近些年来,随着自动语音识别(ASR)技术的发展,识别准确率有了很大的提升。但是,在ASR转写结果中,仍然存在一些对人类来说非常明显的错误。我们并不需要听音频,仅通过观察转写的文本便可发现。对这类错误的纠正往往需要借助一些常识和语法知识,甚至推理的能力。得益于最近无监督预训练语言模型技术的发展,基于纯文本特征的纠错模型可以有效地解决这类问题。本文提出的语义纠错系统分编码器和解码器两个模块,编码器着重于理解ASR系统输出文本的语义,解码器的设计重在使用规范的词汇重新表达。论文链接:
转载请注明:http://www.0431gb208.com/sjszlff/6934.html
上一篇文章: 从肢体语言看预训练语言模型
下一篇文章: 没有了