语音识别能力核心技术掌握在部分厂商手里,目前各大云厂商的ASR价格好像都是商量好的一个价格。我们以腾讯云、阿里云、百度云的语音识别能力价格来看基本优惠后都在8毛每小时,除非特大项目价格才有的商量,但对于部分爱好者和开发人员如果有一款开源的软件就可以发挥自己的想法了。
经过我多年对ASR行业的了解,特别是在年至年我们研发AI机器人的时候测试了各大厂商进行对比,海量的录音模型供机器人学习,包括我们现在使用的ASR解决方案都是经过严格测试的。在8K的机器声学中可谓无人可挡。
再聊聊免费的Kaldi-ASR(卡尔迪)他有多受欢迎呢?小米、西北工业大、等等知名研究单位都对Kaldi非常青睐,通过自行了解技术文档可以私有化部署并且训练,这里就不详细介绍安装过程了,AISHELL公司针对Kaldi进行了封装、优化,方便技术测试,可以自行了解。
年11月15日中国计算机学会语音对话与听觉专业组、AISHELL基金会主办,小米科技、昆山杜克大学、西北工业大学音频语音与语言处理研究组、中国科学技术大学共同协办的“第五届kaldi技术交流会”
总结:通过我们的测试Kaldi可以轻松时间简单的语音识别,但是需要大量的学习模型,建议初学者玩玩,目前感觉还达不到商业化的要求,所以我们也是作为研究使用,在实际业务生产中并不建议采纳,可以通过磐石云
转载请注明:http://www.0431gb208.com/sjsbszl/6941.html