毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

语音翻译也能端到端深度学习这条路有戏

来源:语言识别 时间:2023/3/12
白癜风能根冶吗 http://m.39.net/pf/a_4467180.html

新智元报道

来源:科大讯飞

编辑:文强

科大讯飞日前在全球最具影响力的口语机器翻译评测比赛IWSLT中,获得了语音翻译端到端模型评测的冠军,还成为英德口语翻译任务中唯一受邀做Oralreport的参赛团队。端到端技术是当前语音翻译的研究前沿,科大讯飞联合优化语音识别和机器翻译的新技术路线,理论上更具前景,一旦技术研究成功,将为翻译机器性能的提升带来极大促进。

提问:语音翻译涉及哪些步骤?

你或许会说,语音识别和机器翻译——没错,传统的语音翻译通常采用语音识别和机器翻译级联的方式实现,对输入语音先进行语音识别得到文本结果,然后再基于文本进行机器翻译,这也是当前语音翻译采用的主流方法。

不过,由于口语句子中含有大量非规范语言现象,例如重复、省略、颠倒,以及语义逻辑不清,断句困难等问题,导致后续机器翻译带来严重的挑战。此外,复杂环境下语音识别受发音人口音、环境噪声,以及和语言中存在的同音词、易混淆词等复杂音素的影响也存在着识别错误,对最终机器翻译性能也可能带来影响。

因此,实际应用系统中,通常会在语音识别和机器翻译之间增加一个语音识别后处理模块,通过对识别结果进行规整、断句、顺滑、标点预测,甚至纠错来尽可能地减小口语化和识别错误的影响。

不过,受语音和语言复杂性的影响,截止到目前为止,这些问题并没有被真正解决。

在刚刚结束的年国际口语机器翻译评测比赛(InternationalWorkshoponSpokenLanguageTranslation,IWSLT)中,科大讯飞团队在端到端模型(End-to-EndModel)的评测比赛中,以显著优势夺得第一名。该奖项也是科大讯飞今年在各项国际竞赛中的第9个“世界冠军”。

端到端语音翻译技术路线,是通过构造一个完整的神经网络模型,联合优化语音识别、识别后处理和机器翻译,建立源语言语音信号到目标语言文字的映射关系,进而实现从原始语音到目标译文的翻译。

这提供了一种解决语音翻译的新思路,而且从目前看是初步可行的。一旦技术研究成功,理论上可以让语音翻译更准更快,未来也将为翻译机器性能的提升带来极大促进。

国际顶级口语机器翻译评测比赛IWSLT,推动语音翻译新方向

IWSLT是国际上最具影响力的口语机器翻译评测比赛之一,重点

转载请注明:http://www.0431gb208.com/sjszlff/3679.html

  • 上一篇文章:
  • 下一篇文章: 没有了