智能语音交互方式的出现,对远场识音提出了更高的需求。麦克风阵列是当前最主要的远场拾音方式,但不仅需要额外购买,而且因为尺寸较大需要更改产品的ID设计。
我们近期接触的「语智科技」则希望通过技术创新,不借助麦克风阵列实现远场拾音,且可以实现优于当前主流商用引擎对比的结果。
一般来说,传统ASR技术(自动语音识别技术,AutomaticSpeechRecognition),往往借助麦克风阵列采集声音信号,分别对单路信号进行降噪,将多路语音处理后合成一路,再进行语音识别。使用语智科技的技术,则可以做到使用任意麦克风采集声音信号,直接输入远场语音识别引擎FFASR,在云端进行降噪、回声消除、语音识别。
之所以能做到通过单路信号实现高准确率识别,团队在实现原理、算法方面做了一系列创新。简单来说,技术上重点
转载请注明:http://www.0431gb208.com/sjszlfa/1821.html