WeNet是出门问问语音团队联合西工大语音实验室开源的一款面向工业落地应用的语音识别工具包,该工具用一套简洁的方案提供了语音识别从训练到部署的一条龙服务,其主要特点如下:
使用conformer网络结构和CTC/attentionloss联合优化方法,具有业界一流的识别效果。
提供云上和端上直接部署的方案,最小化模型训练和产品落地之间的工程工作。
框架简洁,模型训练部分完全基于pytorch生态,不依赖于kaldi等安装复杂的工具。
详细的注释和文档,十分适合用于学习端到端语音识别的基础知识和实现细节。
GitHub
转载请注明:http://www.0431gb208.com/sjszlfa/654.html