毕业论文
您现在的位置: 语言识别 >> 语言识别发展 >> 正文 >> 正文

马云的ET语音识别让杭州速记群炸了,为此

来源:语言识别 时间:2022/5/13
年云栖大会让人眼前一亮的,是实时字幕翻译的黑科技——阿里云ET人工智能和它在大会上展示的实时语音识别技术。但这次的技术展示并没有引起行业恐慌,而是没有被大家看好。语音识别尚无法达到人类水平,背后原因何在呢?

亿欧/李基祥

阿里巴巴主办的年云栖大会于10月14日在杭州召开。此次云栖大会让人眼前一亮的,是实时字幕翻译的黑科技——阿里云ET人工智能和它在大会上展示的实时语音识别技术。

如大家所愿,杭州地区的速记群炸了,由于阿里云ET人工智能已经在阿里云栖大会上秀肌肉了,因此很多同行被邀请去“连续四天”做现场速记。

等等,这个剧本是不是拿错了?不应该是速记觉得很恐慌,甚至问马云,“我们的出路在哪里吗?”

情况并非大家所想,人工智能目前在速记行业没有造成恐惧,而是不被看好。

得知这一消息,我们第一时间联系了一位资深速记朋友,想询问速记员们对语音识别是什么看法?会不会面临被取代的危机?但得到的答案却恰恰相反。她告诉我们,速记员们事实上也希望ET机器人这样的人工智能语音识别能够取代他们的工作。然而这个想法现在还不能实现。

首先,准确率仍不能达标。目前语音识别的错误率远高于1/这个速记员的最低标准。李彦宏说百度的语音识别能做到准确率97%,但这就意味着每两行就要错一个字,这样的错误率谁能容忍?

其次,人的灵活度比机器人要高很多。语音机器人目前并不懂断句、不懂标点符号用法、不懂方言口语、不能去除多余的语气词“嗯、啊、哦”等;有些嘉宾多次重复某些话,语音机器人并不能判断这些是否是多余的;同音词也是一个问题,语音机器人不能通过上下文判断同音词的使用;当速记发现前面错了,能够寻回改正,但是语音机器人不可以。

另外这名朋友还告诉我们,目前用人工来为语音识别纠错也不现实。科大讯飞曾招募速记去做错误纠正员,但是没人愿意去。速记听完就打速度很快,但是纠正要经历几个过程“找、删、写”这三个步骤其实比纯打字耗时更长,所以不见得语音机器人能够减轻速记员的负担。

目前看来,语音识别取代速记还要很久,那么现在研究人工智能语音识别的公司都是拿它来做些什么呢?带着这个问题,亿欧对国内外主流公司在语音技术上的布局进行了盘点。

上图盘点了国内在语音技术上有重大布局的9家公司,在9家之中,科大讯飞、百度、中科信利、云知声4家的技术都来自于中科院,可见中科院在国内语音识别技术上的领军地位。此外,上市公司或上市公司控股公司,具有资金和资源优势,其商业化产品多为软件,例如百度语音嵌入百度旗下其他app,搜狗的语音识别应用于搜狗输入法,腾讯的语音识别应用于

转载请注明:http://www.0431gb208.com/sjszyzl/253.html

  • 上一篇文章:
  • 下一篇文章: