毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

Vosk开源语音识别引擎kaldi的开发

来源:语言识别 时间:2022/5/3
语音识别引擎结合媒体服务器实现智能客服集成是很多企业用户的需求之一。如果API或者MRCP接口调用商业语音识别引擎平台的接口费用比较高昂,很多多离线识别和小型终端的支持也不太友好。Vosk是开源的语音识别开发套件,可以支持多种语言,并且可以和开源媒体服务器Asterisk,FreeSWITCH,unimrcp和Jigasi集成(开源jitsi视频会议服务器的SIP接口)实现离线识别。其语音识别引擎使用的是基于开源语音识别引擎kaldi实现。其应用场景包括轻量级的离线语音识别,支持安卓,树莓派等终端设备。

关于MRCP的语音识别详解,搜索历史文档MRCP协议,笔者发布了完整MRCP的完整规范。

参考文档:

转载请注明:http://www.0431gb208.com/sjslczl/110.html