毕业论文
您现在的位置: 语言识别 >> 语言识别发展 >> 正文 >> 正文

微软研发语音识别系统,准确度达到人类水平

来源:语言识别 时间:2022/7/12
白癜风是什么引起的 http://m.39.net/pf/a_4637854.html

语音识别软件虽然还不完美,但其准确率已经人类相差无几了。本周微软人工智能研究团队研发的语音识别系统达到了一个新的里程碑:该系统的文字差错率(worderrorrate,WER)仅为5.9%,与人类记录员转述同样一段话的文字差错率相当,这意味着,该系统已经可以清晰准确地识别两个对话者所说的单词。

Cortana(中文名:微软小娜)是微软发布的全球第一款个人智能助理,它“能够了解用户的喜好和习惯”,“帮助用户进行日程安排、问题回答等”

微软公司官方发布的博客显示,通过坚持不懈的努力,并结合微软公司的开源“计算网络工具包”(ComputationalNetworkToolkit),该研究团队利用数月时间就实现了语音识别准确率与人类相当,而原本预计实现这一目标需要数年时间。

“计算网络工具包”是微软推出的开源深度学习工具包

微软首席语音系统专家黄学东表示:“我们的语音识别系统已经达到了人类水平,这将是一个历史性的突破。”这一语音识别技术的进步也将使微软Cortana语音助手、Xbox游戏平台和Windows操作系统从中受益。

黄学东(前左一)带领的微软人工智能语音识别研究团队

尽管该系统已经很准确,但还远非完美,一些微妙的信号很容易被误解。研究人员在论文中表示,该系统和人类速记员所犯的错误大体类似,但有一个较大的例外,在对简短反馈和迟疑的理解有区别。例如,反馈说“嗯”(uh-huh)表示确认,表明说话人应该继续谈论这一话题,而犹豫的“啊”(uh)表明期待说话人能够把话题转回来。下一步,研究团队希望实现更高的准确性,让其在一些实际生活场景中如一些嘈杂的餐馆、拥挤的街道、强风天气中也能有很好的语音识别效果。按照团队的设想,未来的语音识别系统,不仅仅只是认识别出人类语音,还要真正理解它们。

文章来源:中国国防科技信息网

特别鸣谢编译\述评:中国船舶工业综合技术经济研究院丁宏

转载请注明出处:“电科防务研究”

转载请注明:http://www.0431gb208.com/sjszyzl/796.html

  • 上一篇文章:
  • 下一篇文章: 没有了