毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

多语言识别的实现

来源:语言识别 时间:2022/4/11
白癜风治疗最好的药 http://baidianfeng.39.net/a_yqyy/210614/9060141.html

文/ArindrimaDatta和AnjuliKannan

软件工程师,GoogleResearch

Google的使命不单单是整合全球信息,而是要让大众能够使用这些信息,这意味着我们需要为尽可能多的语言提供我们的产品。而Google助理的核心功能是理解人类语言,这需要支持多种语言,也是我们面临的一大挑战:越是优质的自动语音识别(AutomaticSpeechRecognition,ASR)系统越需要大量视频及文本数据等内容,以便让数据需求型神经模型不断革新。然而,许多语言的可用数据几近为零。

我们一直在思考应当如何保证高质量的语音识别,尤其是语料数据稀缺的语言。研究社区近期的一个重要发现表明,神经网络可以从语料丰富型语言的音频数据中学到的大部分“知识”并应用在语料稀缺型语言上,因此我们无需从头学习所有内容。由此,我们开始了多语言语音识别模型的研究,其中便包含多种语言的学习转录单一模型。

在发表于Interspeech的“基于流式传输端到端模型的大规模多语言语音识别”一文中,我们曾提出了单一模型训练的端到端(End-to-End,E2E)系统,支持实时多语言语音的识别。通过在九种印度语的应用,我们展示了在多个语料稀缺型语言上,ASR显著质量提升,同时也持续改进该系统针对语料富型语言的表现。

注:Interspeech

转载请注明:http://www.0431gb208.com/sjszlfa/2.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 今日推荐
    1. 没有推荐文章
    热点关注
    1. 没有热点文章