国际语音顶级会议INTERSPEECH预计将于今年9月18日-22日在韩国仁川举办。
MagicData(北京爱数智慧科技有限公司)联合中科院声学研究所、上海交通大学和西北工业大学,基于语音识别、说话人日志和关键词检索的相关研究论文《OpenSourceMagicData-RAMC:ARichAnnotatedMandarinConversational(RAMC)SpeechDataset》脱颖而出,成功入选本次大会。
届时,MagicData将作为大会的银级赞助商参与活动,致力于加强工业界和学术界的技术协作,支持会议顺利进行。
INTERSPEECH是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会。本届会议以“HumanandHumanizingSpeechTechnology”为主题,内容涵盖语音识别、自然语言处理、神经机器翻译等领域。
MagicData作为全球领先的AI数据解决方案提供商,以实际业务场景需求为驱动,聚焦ASR、NLP、TTS等领域。在INTERSPEECH中,MagicData论文经过重重审核,最终被大会收录。本文向大家分享MagicData入选论文的主要内容与创新点。
随着智能语音助手、智能家居设备、智能客服等技术被广泛利用,自然对话语音识别的需求量日益增长,越来越多的开发者向语音社区OpenSLR免费开放中文语音数据库,覆盖朗读、会议、访谈、新闻等场景。但自然对话中的口语表达、犹豫、重复、非语言信息等表达不流畅的现象给语音识别任务带来很大的挑战。由于缺乏免费且高质量的自然对话语料库,近年来对话式语音识别研究进展缓慢,探索对话场景中的语音处理技术仍然是一个挑战。
为了进一步丰富开源语音语料库,促进语音语言处理技术的发展,MagicData联合中科院声学研究所、上海交通大学和西北工业大学,在Magichub开源社区正式开源小时中文对话式语音数据集MagicData-RAMC。MagicData-RAMC是一批高质量且标注丰富的训练数据集,能够很好地支持开发者完成语音识别和说话人日志相关的研究。
MagicData-RAMC包括组多轮普通话对话,时长共计小时。每组对话的标注信息包括转录文本、语音活动时间戳、说话人信息、录制信息和话题信息。说话人信息包括了性别、年龄和地域,录制信息包括了环境和设备。
目前,Magichub.
转载请注明:http://www.0431gb208.com/sjszyzl/5218.html