流式语音识别模型(StreamingASRModel)是指可以在处理音频流的过程中,支持实时返回识别结果的一类ASR模型。与之相对的是非流式模型,它必须在处理完整句音频后才能返回结果。流式ASR可以更好地用于需要实时获取识别结果的场景,例如直播实时字幕、会议实时记录、语音输入、语音唤醒等场景。
来源丨知乎
作者丨林泽华
Streamingautomaticspeechrecognition(ASR)aimstoemiteachhypothesizedwordasquicklyandaccuratelyaspossible,whilefull-contextASRwaitsforthe
转载请注明:http://www.0431gb208.com/sjszjzl/82.html