语音翻译也能端到端深度学习这条路有戏

来源：语言识别时间：2023/3/12

白癜风能根冶吗 http://m.39.net/pf/a_4467180.html

新智元报道

来源：科大讯飞

编辑：文强

科大讯飞日前在全球最具影响力的口语机器翻译评测比赛IWSLT中，获得了语音翻译端到端模型评测的冠军，还成为英德口语翻译任务中唯一受邀做Oralreport的参赛团队。端到端技术是当前语音翻译的研究前沿，科大讯飞联合优化语音识别和机器翻译的新技术路线，理论上更具前景，一旦技术研究成功，将为翻译机器性能的提升带来极大促进。

提问：语音翻译涉及哪些步骤？

你或许会说，语音识别和机器翻译——没错，传统的语音翻译通常采用语音识别和机器翻译级联的方式实现，对输入语音先进行语音识别得到文本结果，然后再基于文本进行机器翻译，这也是当前语音翻译采用的主流方法。

不过，由于口语句子中含有大量非规范语言现象，例如重复、省略、颠倒，以及语义逻辑不清，断句困难等问题，导致后续机器翻译带来严重的挑战。此外，复杂环境下语音识别受发音人口音、环境噪声，以及和语言中存在的同音词、易混淆词等复杂音素的影响也存在着识别错误，对最终机器翻译性能也可能带来影响。

因此，实际应用系统中，通常会在语音识别和机器翻译之间增加一个语音识别后处理模块，通过对识别结果进行规整、断句、顺滑、标点预测，甚至纠错来尽可能地减小口语化和识别错误的影响。

不过，受语音和语言复杂性的影响，截止到目前为止，这些问题并没有被真正解决。

在刚刚结束的年国际口语机器翻译评测比赛（InternationalWorkshoponSpokenLanguageTranslation，IWSLT）中，科大讯飞团队在端到端模型（End-to-EndModel）的评测比赛中，以显著优势夺得第一名。该奖项也是科大讯飞今年在各项国际竞赛中的第9个“世界冠军”。

端到端语音翻译技术路线，是通过构造一个完整的神经网络模型，联合优化语音识别、识别后处理和机器翻译，建立源语言语音信号到目标语言文字的映射关系，进而实现从原始语音到目标译文的翻译。

这提供了一种解决语音翻译的新思路，而且从目前看是初步可行的。一旦技术研究成功，理论上可以让语音翻译更准更快，未来也将为翻译机器性能的提升带来极大促进。

国际顶级口语机器翻译评测比赛IWSLT，推动语音翻译新方向

IWSLT是国际上最具影响力的口语机器翻译评测比赛之一，重点

转载请注明：http://www.0431gb208.com/sjszlff/3679.html

上一篇文章：科研管理中文分词算法在地址标准化清洗

下一篇文章：没有了