端到端语音识别时代来临网易杭州研究院的智

来源：语言识别时间：2022/6/10

北京治白癜风最好的医院是哪家 https://wapyyk.39.net/bj/zhuanke/89ac7.html
　　　　　　　　　　作者

蔡芳芳　　　　　　采访嘉宾

刘东　　　　　　AI前线导读：从上世纪50年代诞生到年引入DNN后识别效果真正达到实用化，语音识别技术花了快六十年，但在深度学习的助力之下，语音识别从实用到超过人类水平并没有花费太多时间。以前，业界更多使用的是传统的DNN-HMM混合模型，需要借助对齐信息和上下文相关音素才能达到比较好的识别准确率。年以后，CTC算法兴起，简化了训练过程，而且识别效果毫不逊色，语音界纷纷投入大量资源训练更深、更复杂的神经网络，利用端到端技术进一步大幅提升语音识别的性能。年12月，谷歌提出“使用序列到序列模型的当前最佳语音识别系统”（State-of-the-artSpeechRecognitionWithSequence-to-SequenceModels），将词错率降低至5.6%，优于人类表现。自此，基于Attention机制的新型端到端语音识别系统成为了ASR领域的研究主流。从语音领域国际顶会Interspeech来看，Attention相关算法几乎出现在了今年所有语音识别或者说话人识别研究的文章中。端到端语音识别的时代已经来临。更多优质内容请

转载请注明：http://www.0431gb208.com/sjszlff/537.html

上一篇文章：语音识别软件辅助纠正发音

下一篇文章： STM32的智能语音识别的柔光台灯设计