公开数据集WenetSpeech10

来源：语言识别时间：2022/5/11

WenetSpeech

小时的中文语音识别数据集

该数据集是一个+小时多领域中文语音识别语料库，所有数据均来自YouTube和Podcast。采用光学字符识别(OCR)和自动语音识别(ASR)技术分别标记每个YouTube和Podcast录音。为了提高语料库的质量，作者使用一种新颖的端到端标签错误检测方法来进一步验证和过滤数据。

数据集下载链接