随着AI第三次浪潮的掀起,各行各业都在尝试着与AI进行深度结合。自动驾驶、图像识别、AI绘画、AI作曲等新的应用层出不穷。在专利领域中,AI技术已经应用到科技情报分析、专利检索、专利翻译和专利撰写等方面,并取得了一些进展。
本文主要向大家介绍AI技术在专利翻译方面的探索概况。
专利翻译利用了哪些AI技术?
机器翻译主要应用了神经网络技术,将确定的输入和输出给予多层神经网络进行训练。通过不断训练,找到隐层结点中的若干个系数,从而得到机器翻译模型。使用者输入原文,机器翻译模型即可输出译文。
从以上基本原理可以看出,输入和输出的质量对翻译模型的好坏起到至关重要的作用。在专利翻译中,输入即为原文,输出即为精准译文。
如何衡量机器翻译的质量?
目前比较流行的自动评测方法是IBM提出的BLEU算法,BLEU(bilingualevaluationunderstudy)。BLEU算法采用的是一种N-gram匹配规则,原理比较简单,就是机翻译文和精准译文之间n组词的相似占比。例如,机翻译文为Itisanicedaytoday,精准译文是Todayisaniceday,机器译文一共6个词,有5个词语都命中的了参考译文,那么它1-gram的BLEU值为5/6=0.83。
简单来说,BLEU算法的思想就是机翻译文越接近精准译文的结果,它的BLEU值就越高,翻译质量就越高。
发展现状
目前,通过专利信息年会或者互联网搜索,我们都不难发现很多覆盖多国语言的机器翻译引擎。除了像google、百度这样的大厂出品之外,也不乏出现了很多专注于专利领域的机器翻译引擎。这些翻译引擎究竟达到了怎样的水平呢?
本文以中英互译为例,对Google、百度、WIPO和优选字符等组织的中英互译引擎进行了BLEU值比较。从翻译结果来看,在专利申请翻译领域,最佳机器翻译的平均BLEU值可以达到0.55,在审查意见翻译领域,最佳机器翻译水平可以达到0.65(具体结果请见附录页[1])。
除了BLEU值的比较,我们以一个权利要求为例更为直观地展示机器翻译目前所能达到的水平:
原文:
1.Apersonalrespiratoryprotectiondevice
转载请注明:http://www.0431gb208.com/sjszjzl/3538.html