一心二用高性能端到端语音翻译模型同时识别

来源：语言识别时间：2022/7/25

做家

董倩倩编纂

刘冰一

主动语音翻译是指让机械终了从源言语的语消息号主动翻译生成目口号言的文本的进程，其基础假想是让谋划机像人类舌人相同充任持不同言语言语人之间翻译的脚色。

AI科技谈论这日引见一篇发布在AAAI上最新的端到端语音翻译的一项劳动：COSTT，用一个接连的解码器同时做到对语音中源文字的鉴别并将其翻译为目口号言，其最大益处为可哄骗相对大批的文本平行语料来辅佐练习，灵验缓和语音翻译数据不够的限制。

道格拉斯·亚当斯（DouglasAdams）在小说《天河系遨游指南》（《TheHitchhiker’sGuidetotheGalaxy》）里怀念了一种叫巴别鱼（Babelfish）的奇特生物。人们带领巴别鱼后，就可以够在它的辅佐下听懂任何别国言语。巴别鱼的名字根源于《圣经》里知名的故事“巴别塔”：人类想上天国，发端制造叫做巴别塔的通天巨塔。天主为阻挡人类登天，迫令人类说不同的言语。由于疏导不畅，巴别塔规划最后半路而废。

那末能否能够将一种言语的语音直接更改为其它一种言语的文字呢？

这即是语音翻译需求治理的题目。语音翻译系统在观望海外影视做品、开展长途国际会议等时势有宽泛的运用。

保守的语音翻译系统采取级联方法，由两个模块构成，离别是语音鉴别系统和机械翻译系统，前者先将言语鉴别成文本，后者再翻译成别国文字。在这个进程中存在特别严峻的过错积聚和推迟积聚题目，是以，基于端到端建模的主动语音翻译研讨法子应运而生。在端到端系统中，不再有两个自力模块，而是一个统一的模子直接把音频更改为翻译后的文本。

这篇文章给众人引见AAAI上的一篇研讨主动语音翻译的劳动，《COnsecutiveDecodingforSpeech-to-textTranslation》[1]，简称COSTT，做家来自中科院主动化所和字节跳动人为智能实践室。

这篇劳动主如果研讨了端到端模子中语音鉴别和语音翻译的方针序列何如连结研习。

论文

转载请注明：http://www.0431gb208.com/sjsbszl/954.html

上一篇文章：还在找图片翻译软件这个一键图片识别翻译多

下一篇文章：让生活服务ldquo说到做到rdq