流式语音识别原理和实现思路

来源：语言识别时间：2022/5/1

流式语音识别模型（StreamingASRModel）是指可以在处理音频流的过程中，支持实时返回识别结果的一类ASR模型。与之相对的是非流式模型，它必须在处理完整句音频后才能返回结果。流式ASR可以更好地用于需要实时获取识别结果的场景，例如直播实时字幕、会议实时记录、语音输入、语音唤醒等场景。

来源丨知乎

作者丨林泽华

Streamingautomaticspeechrecognition(ASR)aimstoemiteachhypothesizedwordasquicklyandaccuratelyaspossible,whilefull-contextASRwaitsforthe