简单粗暴而有效的改图自动语音识别数据扩增

来源：语言识别时间：2024/9/30

北京看白癜风去哪个医院最好 http://pf.39.net/bdfyy/xwdt/
神经网络的调参无疑是一个巨大的工程。如何在调参之前拥有更佳的表现？千辛万苦调好了但却过拟合，如何拥有更好的泛化能力？这无疑是人肉调参的必经之痛。一个通用的认知是，训练数据会限制模型表现的上限，能拥有更好的训练数据，无疑成功了一大截儿。近日，DanielS.Park等人在自动语音识别（AutomaticSpeechRecognition，ASR）模型训练上，找到了一种简单却强大的数据增强方法——SpecAugment。该操作另辟蹊径，将原始语音数据生成的梅尔倒谱图直接进行图像变换，扩增训练数据，化腐朽为神奇，结果很棒。啥是自动语音识别自动语音识别，即依托深度神经网络模型将语音自动识别为文本输入，无论是Siri助手还是微软小冰，抑或占据生活一部分的

转载请注明：http://www.0431gb208.com/sjszlff/7653.html

上一篇文章： ChatGPT与BingAI的语言智商

下一篇文章：阿尔法蛋AI词典笔X10评测K12辅导帮