毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

比讯飞语音还强大微软的语音识别引擎能像

来源:语言识别 时间:2022/4/19
刘军连 https://wapjbk.39.net/yiyuanfengcai/ys_bjzkbdfyy/793/

燕山隐士

(图片来源于网络)

锤子科技的发布会上,老罗和朱萧木演示的讯飞语音输入给观众留下了深刻的印象,很多人从来没有注意到过,汉语的语音输入速度和识别正确率已经达到了如此的高度,作为世界上最难的语言之一,汉语和计算机的屏障进一步被打通。与讯飞语音识别输入的方向不同,微软则从实时语言翻译方面进行更深入的研究。

(搜索自Google)

当人们尝试去一次性的转述翻译一个对话时,平均有5.9%的内容是没有听到丢失了,这样就会对翻译的正确性产生影响。微软在本周二宣布,他们可以令计算机像人类一样进行实时翻译,微软的首席语音专家黄学东(音译)在一份声明中说,“我们终于到达了人人平等交流”。

(搜索自Google)

微软团队利用类似于联合词语云的神经语言模型,也就是说,语速快的地方会比语速慢的地方得到优先处理,这样语音识别引擎会在词之间先进行概括,保证在上下文中更好的识别语义。该团队里用微软自己的深度学习网络开发工具来提升算法效率。

该团队的下一个月目标是提升算法引擎的可靠性,使其可用于现实生活中的情况,例如在拥挤的城市街道或者车内嘈杂的环境,不同的用户可以同时使用一个设备工作等等。↓↓↓

预览时标签不可点收录于话题#个上一篇下一篇

转载请注明:http://www.0431gb208.com/sjslczl/26.html

  • 上一篇文章:
  • 下一篇文章: 没有了