毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

语音识别蛋糕还在,科大讯飞悬了

来源:语言识别 时间:2022/5/11

比你更有钱、有技术、有资源、有市场、有人才,这就是现在的传统语音技术公司面对互联网巨头竞争时的困境。

《汽车商业评论》记者钱亚光

在当下的汽车业,语音基于其交互的自然性,被认为是未来人与车交互的主要入口路径,以致业内普遍认为,“以语音为入口连接各种服务,构建车联网生态”。

作为人工智能应用最成熟的技术之一,目前语音交互的核心环节也取得重大突破,语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现一种整体的交互方案。

不过,虽然大多数新车可以用语音开启车载导航,设置行车路线,进行信息查询,实现一些诸如空调、天窗等功能控制,但距离“以语音为入口连接各种服务,构建车联网生态”的理想仍然较远。

比如,在真实使用场景中,距离麦克风的远近、交谈时是否说方言,以及噪音、断句等,都会让语音识别的准确率大打折扣。

目前,业内普遍宣称的97%识别准确率,更多的是人工测评结果,只在安静室内的近场识别中才能实现。

更难的是,在交互的过程中,机器对于语音的理解,以及人机多人的交互对话,都存在问题。

人在说话时,往往会一词多义,人会基于已有知识储备和上下文环境进行理解,但现在的智能语音技术很难做到。

它对于说话者的口误,容错做得也不理想。用户往往会追求多样性,包括使用过程中偶然状况的多样性以及场景的多样性等,因此容错技术显得尤为重要。

显然,目前智能语音的发展远未成熟,有着巨大的提升空间。再加上智能语音技术的巨大市场空间,互联网巨头已经争相进入这一市场。

在中国,《汽车商业评论》注意到,百度、阿里巴巴、腾讯等诸多互联网巨头已经入局,并先后推出自己的产品,以抢得智能语音信息流入口先机。

随着互联网巨头进军智能语音领域,转为全栈的语音技术创业公司,类似科大讯飞这样的传统智能语音技术巨头的不可替代性也受到了不可忽视的打击,更多这几年新兴的语音技术公司更是命运叵测。

互联网巨头虽然入场较晚,但凭借着自有的雄厚资金和互联网行业的大数据资源,他们发展自家的人工智能技术,迅速抢占智能语音市场。

那么,在未来的车联网智能语音领域,谁将是主宰?

以百度为例,这家以搜索起家的互联网巨头,正在转型为人工智能公司,并在通用技术、算法和平台开发等领域发展,对话式AI操作系统百度DuerOS是其语音技术的重要平台。

从年年开始百度就将智能语音作为战略方向,如今,百度语音技术已经形成从模型算法、开发组件、场景覆盖到行业应用的全链条。

年4月,北京车展上,博泰联合开发搭载百度DuerOS的人工智能车机系统——东风风神WindLink3.0,在学习能力、计算能力和数据储备上极具优势,可极快听清并真正听懂人复杂语言,并秒级提供用户所需答案。

比如,只要用正常甚至很快的语速说“好热”“帮我看看附近带泳池和WIFI的酒店”,系统就可以自动调节空调温度、搜索出对应的结果,直接完成房间的预定,然后再导航到该酒店。

作为人工智能时代开放赋能的生态系统,DuerOS通过自身三大核心技术“唤醒”你的车:让车听清你在说什么;让车听懂你想要什么;让车满足你所提出的需求。

互联网巨头之所以能够在AI语音上发展如此迅速,跟其大多是市场驱动的企业有关,明显的特点就是他们有自己更好的产业落地环境,

转载请注明:http://www.0431gb208.com/sjszlff/241.html