MagicData论文入选国际语音顶级大

来源：语言识别时间：2023/7/10

哪里治疗白癜风效果好 http://pf.39.net/bdfyy/bdfhl/141022/4499920.html

国际语音顶级会议INTERSPEECH预计将于今年9月18日-22日在韩国仁川举办。

MagicData（北京爱数智慧科技有限公司）联合中科院声学研究所、上海交通大学和西北工业大学，基于语音识别、说话人日志和关键词检索的相关研究论文《OpenSourceMagicData-RAMC:ARichAnnotatedMandarinConversational(RAMC)SpeechDataset》脱颖而出，成功入选本次大会。

届时，MagicData将作为大会的银级赞助商参与活动，致力于加强工业界和学术界的技术协作，支持会议顺利进行。

INTERSPEECH是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一，是全球最大的综合性语音信号处理领域的科技盛会。本届会议以“HumanandHumanizingSpeechTechnology”为主题，内容涵盖语音识别、自然语言处理、神经机器翻译等领域。

MagicData作为全球领先的AI数据解决方案提供商，以实际业务场景需求为驱动，聚焦ASR、NLP、TTS等领域。在INTERSPEECH中，MagicData论文经过重重审核，最终被大会收录。本文向大家分享MagicData入选论文的主要内容与创新点。

随着智能语音助手、智能家居设备、智能客服等技术被广泛利用，自然对话语音识别的需求量日益增长，越来越多的开发者向语音社区OpenSLR免费开放中文语音数据库，覆盖朗读、会议、访谈、新闻等场景。但自然对话中的口语表达、犹豫、重复、非语言信息等表达不流畅的现象给语音识别任务带来很大的挑战。由于缺乏免费且高质量的自然对话语料库，近年来对话式语音识别研究进展缓慢，探索对话场景中的语音处理技术仍然是一个挑战。

为了进一步丰富开源语音语料库，促进语音语言处理技术的发展，MagicData联合中科院声学研究所、上海交通大学和西北工业大学，在Magichub开源社区正式开源小时中文对话式语音数据集MagicData-RAMC。MagicData-RAMC是一批高质量且标注丰富的训练数据集，能够很好地支持开发者完成语音识别和说话人日志相关的研究。

MagicData-RAMC包括组多轮普通话对话，时长共计小时。每组对话的标注信息包括转录文本、语音活动时间戳、说话人信息、录制信息和话题信息。说话人信息包括了性别、年龄和地域，录制信息包括了环境和设备。

目前，Magichub.

转载请注明：http://www.0431gb208.com/sjszyzl/5218.html

上一篇文章：保护个人信息,国家出手了温州交警

下一篇文章：中华人民共和国个人信息保护法邢台网警巡