毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

智能音箱不智能,口音识别问题或成其发展的

来源:语言识别 时间:2023/6/16
北京哪个白癜风医院比较好 https://m-mip.39.net/disease/yldt/bjzkbdfyy/

智能音箱的语音识别功能正逐渐发达,然而仍旧存在着很多问题亟待解决。

今天我们来一起聊一聊智能音箱在识别有口音的语音时会出现什么问题。

我们测试了亚马逊的Alexa和GoogleHome,来看一看那些带有口音的人是如何在智能音箱的革命中落后的。

当MeghanCruz说:“Hey,Alexa”,她的亚马逊音箱立即被唤醒,当她用轻松的西海岸口音和Alexa聊天时,Alexa流畅地回答了她的每一个问题,告诉她柏林的天气、世界上最毒的动物是什么以及的平方根。

但是当AndreaMoncada,一个哥伦比亚长大的温哥华居民,用她轻盈的西班牙口音说出同样的话时,Alexa只是耸了耸肩,当Andrea要求她回答另一个问题时,Alexa轻声说着对不起。她让Alexa关掉音乐,结果音量反而上升了。

“大家都说我的英文挺好的,没有什么口音,但是Alexa完全听不懂我说话”Andrea说。

不得不承认,Amazon的Alexa和Google的Home正在带头一场声控革命,这场革命迅速改变了世界各地数百万人学习新事物和生活的方式。

但是对于有口音(即使是美国各他们地的方言)的人来说,这些智能音箱的态度完全不同:漫不经心、毫无反应,甚至孤立。对于很多人来说,这场未来科技的浪潮似乎带着偏见,将他们甩在了后面。

华盛顿邮报与两个研究小组合作,研究智能音箱的口音失衡问题,他们测试了近20个城市超过个人的数千条语音指令。他们发现音箱的系统在对来自不同地区的人们的语音识别与理解上有着相当大的差别。

GoogleHome对于西方口音的理解准确度比南方口音高了3%,而Amazon的Alexa则是对东海岸口音的识别率更高,比中西部地区高了2%。研究人员认为,这可能与该系统在全国不同地区的销售情况和销售方式有关。

然而对于那些非英语母语的人结果更加惨烈,在测试Alexa对于非英语母语的人的语音识别与理解的研究中,Alexa的准确度低至-30%。

例如,西班牙语为母语的人比在华盛顿长大的人的准确度少了6%。

研究语音识别的数据科学家RachaelTatman表示:“这些系统最适合受过高等教育的、中上阶层的美国白人,因为这个群体从一开始就能接触到这项技术。

智能音箱系统最开始学习的就是美国电视新闻播音员的标准式“广播英语”,也就是“普通话”。人工智能通过处理大量声音数据,学习普通话的模式,在短语、单词和声音之间形成纽带。

让人工智能学习所有不同的学习方式、不同的口音是非常困难的,一些不太常见的口音很容易被系统误解或忽视。

RachaelTatman担忧道:“我担心我们正处于这样一个境地:这些智能工具对于某些人来说比其他人更有用。

智能音箱的口音问题是这些科技公司面临的关键挑战之一。他们要思考如何既让今天的用户满意,又能够同时在全球范围内扩展自己的影响力。Amazon和Google表示他们正在投入更多的资源来训练和测试不同的语言和口音系统。

研究人员没有测试其他的语音平台,比如苹果的siri或者微软的Cortana,这些平台目前用户使用率比Alexa和GoogleHome要低很多。美国的智能音箱业务一直以亚马逊-谷歌双头垄断为主;他们最大的竞争对手是苹果价值美元的HomePod,但它仅仅控制着大约1%的市场份额。

市场研究公司Canalys称,到今年年底,全球将会卖出1亿台智能音箱。Alexa目前会说英语、德语、日语,从上月开始,它学会了说法语;而GoogleHome除了会上述语言还会意大利语,且在年底它将学会30多种语言。

研究人员称,目前中国式英语、印度英语以及西班牙口音的英语的整体理解准确率约为80%。但是随着声音成为人类和计算机互动的主要方式之一,即使是一个轻微的理解上的差距也可能会成为沟通上的一大障碍。

这一沟通障碍实际上使很多有口音的使用者感到为难和窘迫。

33岁的加利福尼亚海洋生物学家YagoDoson,在巴塞罗那长大,已经说了13年英语,他说:“当你处于社交场合时,你更不愿意去使用它,因为你会想‘这个东西理解不了我,人们会取笑我的,他们会嫌弃我的英文说的不好。’”

Doson说他的一些朋友可以用智能音箱做任何事情,但是他永远不会去买音箱的,因为他有太多不愉快的经历。他补充说:“如果音箱总是理解不了我的话,我会觉得,我永远不可能做到和别人一样的事情,只是因为我有口音。”

当然,人工智能对于语音识别上的障碍并不仅仅是美国人所要面对的挑战。中国的百度硅谷办公室的高级研究员GregoryDiamos称,百度目前也面临着一个很大挑战,他们希望开发出一个能够理解中国各个方言的人工智能。

这些科技公司的目标是开发出的人工智能不仅能回答问题,又能向家人一样随意地进行自然的交谈和聊天,说起话来像是一个真正的人类。

今年5月,谷歌推出了一款名为Duplex的系统,可以通过手机向人工智能机器人预定晚餐,这个机器人的声音非常拟人化,在说话时还会带一些类似于“嗯…”“啊…”之类的语气词。

像这样的更拟人化的技术可以让更多的人感受到机器是真的在听我们讲话。但与此同时,像AndreaMoncada这样有口音的很多人表示,他们觉得自己陷入了一个奇怪的中间境地:人们可以理解他们,但机器却将他们拒之门外。

“我有点难过”,她说,“这个设备可以做很多事,但偏偏它理解不了我。”

-End-

编辑:Stephanie

本文章图片来源于网络,侵权必删

想要了解更多人工智能领域的行业动态,欢迎

转载请注明:http://www.0431gb208.com/sjsbszl/5037.html

  • 上一篇文章:
  • 下一篇文章: 没有了