毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

简单粗暴而有效的改图自动语音识别数据扩增

来源:语言识别 时间:2024/9/30
北京看白癜风去哪个医院最好 http://pf.39.net/bdfyy/xwdt/
神经网络的调参无疑是一个巨大的工程。如何在调参之前拥有更佳的表现?千辛万苦调好了但却过拟合,如何拥有更好的泛化能力?这无疑是人肉调参的必经之痛。一个通用的认知是,训练数据会限制模型表现的上限,能拥有更好的训练数据,无疑成功了一大截儿。近日,DanielS.Park等人在自动语音识别(AutomaticSpeechRecognition,ASR)模型训练上,找到了一种简单却强大的数据增强方法——SpecAugment。该操作另辟蹊径,将原始语音数据生成的梅尔倒谱图直接进行图像变换,扩增训练数据,化腐朽为神奇,结果很棒。啥是自动语音识别自动语音识别,即依托深度神经网络模型将语音自动识别为文本输入,无论是Siri助手还是微软小冰,抑或占据生活一部分的

转载请注明:http://www.0431gb208.com/sjszlff/7653.html