WeNet是出门问问联合西北工业大学推出的端到端语音识别工具,并且已经开源在Github上。为了方便大家使用,本文将教大家如何在Android手机中构建一个语音识别系统。
本文示例运行的环境为CPU(Intelx86_64)+MacOS。
环境配置AndroidStudio下载WeNet的源代码后,我们需要安装AndroidStudio进行开发与调试。启动AndroidStudio,打开偏好设置,搜索SDK。打开SDKTools标签页后,我们需要安装一些构建工具:
AndroidSDKBuild-Tools:30.0.3NDK:22.0.AndroidSDKCommand-lineTools:4.0.0CMake:3.10.2.AndroidEmulatorAndroidSDKPlatform-tool上述工具体积较大,而且对Google的访问速度不尽人意,所以大家需要耐心等待或者使用代理。
Android手机为了方便调试,我们还需要准备一台Android手机(虚拟机的性能较低)。在手机上开启开发者选项,并且开启USB调试选项。准备就绪后,将手机连接电脑。
WeNet一切工作准备就绪后,用AndroidStudio打开已有项目runtime/device/android/wenet。在运行程序之前,我们依旧需要下载WeNet提供的压缩包。解压缩得到我们需要的模型final.zip和词典words.txt,并且将它们放到app/assets目录下:
点击运行,稍后便可以看到手机上启动了WeNet的Demo,点击STARTRECORD按钮就可以开始录音并且识别:
常见问题和解决方法比较常见的问题是在Windows系统上开发,会遇到缺失部分源代码的问题。这是因为我们为了复用一些核心的代码,使用了软链接将core目录下的代码链到device/android/wenet/app/src/main/cpp目录下,而Windows默认不支持软链接,有两种解决的方法:
简单粗暴的方法就是将core目录下的内容直接复制到device/android/wenet/app/src/main/cpp目录下开启Windows的开发者选项,然后设置core.symlinks选项重新下载WeNet源代码编译即可:$gitclone-ccore.symlinks=true
转载请注明:http://www.0431gb208.com/sjslczl/149.html