毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

再获国际AI顶会双料冠军,好未来语音识别

来源:语言识别 时间:2022/7/11
白癜风如何治愈 https://baike.baidu.com/item/%E9%A3%8E%E6%9D%A5%E4%BA%86%C2%B7%E5%B8%A6%E4%BD%A0%E8%B5%B0%E5%87%BA%E7%99%BD%E7%99%9C%E9%A3%8E%E9%98%B4%E9%9C%BE/20783753?fr=aladdin
已购《培训行业这一年·》的读者可在多知网订阅号回复“新书惊喜”,参与读书话题讨论。多知网4月12日消息,近日,好未来斩获INTERSPEECH“非母语儿童识别”(TheINTERSPEECHsharedtaskonAutomaticSpeechRecognitionfornon-nativechildren’sspeech)双料冠军。INTERSPEECH作为由国际语音通信协会ISCA组织的语音研究领域的顶级会议,是全球最大的综合性语音信号处理领域的科技盛会之一,好未来最终以词错率低于第二名而夺冠。本次竞赛的赛题是解决非母语儿童语音识别问题。由于儿童语音天生的差异性,包含生理差异(如儿童声道长度较短)、认知差异(如语言习得水平较低,常出现语法逻辑错误、发音前置错误、发音不完整和语种混杂等情况),以及行为差异(如儿童习惯低声私语)等,导致通用语音识别模型难以适配,这就让非母语儿童语音识别系统的构建更具挑战性。另一方面则是非母语儿童语音的数据资源较为稀缺,使得常规声学建模方法在该场景下很难奏效。针对上述挑战,好未来AI语音团队凭借在实际教育场景中积累的丰富经验,充分结合儿童语音在生理特征及语言认知方面的特殊性,尝试了不同的解决方法。比如在数据及特征层面,采用对不同学龄阶段的儿童进行归一化、非语言符号共享、非流利语料生成、分级语言模型构建、半监督语音活动检测等方法进行针对性优化;在声学建模层面,采用深度多流CNN与无监督pre-training结合的方案,提升低资源场景下的非母语儿童语音识别性能。(竞赛系统最终排名,好未来(tal_speech)遥遥领先)竞赛中,好未来最终提交的系统以词错率低于第二名而夺得冠军。该系统更加适配儿童语音识别场景,识别结果准确度更高,更重要的是这项技术的进阶与应用,能够更大程度地避免通用模型识别儿童语音不准确对孩子学习自信心和积极性造成的负面影响。本次成功摘取“双冠”的语音识别技术,已经广泛应用于好未来旗下各教育产品中,解决教育场景中的真实问题。一方面,好未来用AI语音技术充分调动孩子的积极性,为他们提供全新的学习体验。如好未来将AI语音识别应用于语文、英语的字词学习环节,对学生语音实时转录,结合语音评测技术,判断学生对知识点的掌握度,智能地推送学习内容,个性化地安排学习进度和学习路径。另一方面,AI语音技术也被应用到学而思培优小班课的消息盒子与学而思网校大班课的语音弹幕功能中。该技术能够将孩子的发言实时展现,及时反馈,激励孩子主动融入课堂,探索学习的乐趣,让课堂不再是老师的“独角戏”。课后孩子与老师的互动同样值得

转载请注明:http://www.0431gb208.com/sjslczl/758.html