搜狗知音引擎再发重量级产品实时语音翻译迎来质变时代
随着语音翻译的正确率大幅度提高,或许不久的将来,同传翻译将会加入被机器人替代掉的失业大军。
在乌镇的互联网大会上,搜狗CEO王小川发表了以《人工智能的未来之路》为主题的演讲。这是一场在中国举行的国际性会议,为了方便来自全球的听众,王小川亮出了搜狗的秘密武器:机器同传,即实时语音翻译。
王小川用中文演讲,他的讲话内容被语音识别为中文显示在大屏幕上,在中文的下面,还有一排同步翻译出来的英文。从语音识别到完成机器翻译,整个翻译的过程只需要两秒。据悉,语音实时翻译技术是搜狗语音交互引擎“知音”最新推出的重要功能,也是知音引擎取得的又一重大技术突破。
搜狗语音交互中心技术负责人陈伟11月21日接受了懂懂的采访,在谈到这一重大突破的研发过程时,用了这样一句话:“whatispossibleinprincipleisnotalwayswhatissimpleinpractice。”(译为“看起来容易做起来很难”)
准确率可以提升30%-40%,神经网络给机器翻译带来质变
以输入法起家的搜狗,近几年一直在AI方面做了大量的研究和探索工作。今年8月份,搜狗知音引擎发布。时隔三个月,语音实时翻译技术发布,这是知音引擎的一项新能力:基于大数据和神经网络的深度学习,将语音识别和机器翻译两项技术打通,在2秒钟内完成端到端的翻译过程。
对于用户而言,看上去极其简单:对着机器说出中文,2秒钟后翻译好的英文就出来了,几乎没有延迟感。但实现这个过程,对于后台却是极大的挑战,用传统的机器翻译的方法,已经不能保证翻译的速度和正确率。
据陈伟介绍,搜狗机器翻译融合了业界领先的端到端神经机器翻译技术以及基于实例的翻译技术,使用的端到端神经网络翻译模型通过编码端获取源端句子的分布式表示,利用注意力模型聚焦源端,使用循环神经网络生成翻译结果,翻译的结果比传统机器翻译更加流畅,效果更好。
到底什么是端到端?什么是神经网络?比传统的机器翻译有什么本质的不同?
搜狗语音交互中心负责人王砚峰告诉懂懂:传统的机器翻译都是通过规则去做,比如用人脑想一些特征、规则,机器会根据这些特征和规则得出翻译的结果。翻译结果的好不好,在取决于人制定的规则好不好。而端到端神经网络翻译模型,是完全通过模型,放多个参数进去,通过机器学习,把这些参数进行组合。“把参数和模型构建好,机器自己去跑就可以了。机器越跑越聪明,这可以更优雅、更精准地完在翻译的工作。”
机器翻译已经是存在多年的技术,但是翻译的正确率始终无法得到关键性的突破,根本在于“不智能”,不会自我学习。最近机器翻译逐渐迁移到了基于神经网络的技术上。前一段时间GOOGLE基于神经网络的翻译引起业界的广泛
转载请注明:http://www.0431gb208.com/sjslczl/4049.html