关于语音识别芯片的那些事儿

来源：语言识别时间：2022/6/19

语音识别芯片也叫语音识别IC，与传统的语音芯片相比，语音识别芯片最大的特点就是能够语音识别，它能让机器听懂人类的语音，并且可以根据命令执行各种动作，如眨眼睛、动嘴巴（智能娃娃）。除此之外，语音识别芯片还具有高品质、高压缩率录音放音功能，可实现人机对话。

语音识别芯片所涉及的技术包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。

从使用者的限制来分类，语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。

特定人语音识别

特定人语音识别芯片是针对指定人的语音识别，其他人的话不识别，须先把使用者的语音参考样本存入当成比对的资料库，即特定人语音识别在使用前必须要进行语音训练，一般按照机器提示训练2遍语音词条即可使用。

非特定人语音识别

非特定人语音识别是不用针对指定的人的识别技术，不分年龄、性别，只要说相同语言就可以。应用这种芯片的机器（智能娃娃、电子宠物、儿童电脑）就具有交互功能了。非特定人语音识别应用有的是基于音素的算法，这种模式下不需要采集很多人的声音样本就可以做交互识别，但是缺点是识别率不高，识别性能不稳定。

从说话方式的连续性来分类，语音识别芯片又可分为非连续语音识别和连续语音识别。

非连续语音识别

对于非连续语音来说，识别所说的每一个字必须分开辨认，要求说完每个字后都要停顿。

连续语音识别

连续语音识别可以一般自然流利的说话方式来进行人性化的语音识别，但由于关系到相连音的问题，很难达到好的辨认效果。

科大讯飞

一家专业从事智能语音及语言技术、人工智能技术研究，软件及芯片产品开发，语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞的语音输入识别成功率已达到了97%，即使是离线识别准确率也达到了95%。

百度语音

作为智能语音云平台，主要使用离线在线融合技术，识别技术很强，十倍准确率达到90%以上。

腾讯