毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

他们用AI,让大山里的孩子也能说好普

来源:语言识别 时间:2022/8/16

机器之心原创

作者:蛋酱

他们用AI帮助千千万万个「丁真」学习普通话,走出大山,走向更好的未来。

「我的家在四川甘孜州理塘县,就住在格聂雪山脚下。在我们村庄,每天推开门就能看见格聂雪山。这就是我的世界……」

伴随着「丁真」的名字火遍全国,理塘也越来越为人所熟知。

图片来源:理塘县人民政府

雪山、草原、冰川、寺庙、白塔……这里有着如画的风景,无愧于它「天空之城」的称号。但受制于交通、地理、海拔等因素,不少生活在山区的儿童仍然缺乏与外界的连接。部分地区的素养教育资源分配不均匀,且网络信息良莠不齐,很多山区儿童缺乏良好的学习普通话的条件。

普通话对于下一代的教育尤为重要。听得懂普通话,才有机会学习到更多的知识,也能带动更多当地大人说普通话,从而达到“小手拉大手”的目的。

那么,如何帮助山区儿童学习课外知识、提高普通话水平?如何为他们提供素养提升的正规渠道?在近日落幕的第二届腾讯Light公益创新挑战赛上,一款名为「语言海洋泡泡」的获奖作品,吸引了不少人的目光。

在「泡泡」里学习普通话

「对于我们来说,讲普通话是一件很简单的事情,毕竟我们从小在城市中长大,接受的教育都是以普通话进行的。但是在山区和更偏远的地方,孩子们用来交流的是他们的方言,学习普通话的氛围是不足的。」在决赛路演中,北辰之星团队成员分享了自己的感悟。

北辰之星团队的成员来自国内外的几所高校。这些年轻人中,年龄最大的只有24岁,此外还包括两位00后成员。虽然身处不同的地区,但他们在读书期间都参加过一些关于普通话推广的公益项目。

也是这些社会实践给了他们一些启发。在一次面向理塘当地的调研中,一位团队成员曾在藏民家中与其家庭成员进行交谈,他观察到,接受普通话教育的年龄阶段、环境,对一个人学习普通话的水平具备关键影响。

「藏民家有三个女儿,年龄最小的女儿普通话说得最流利,也是最喜欢说普通话的。在藏区,青壮年说普通话的人数要比老年人的人数更多。」

但在一些偏远的地区,小朋友要想获得充分的基础普通话学习渠道极其不易。

假如以小游戏的形式,设计一款普通话教学产品呢?基于这样的灵感,几位成员一拍即合,决定为偏远地区的儿童打造一款寓教于乐、提升普通话水平的趣味公益应用。

「语言海洋泡泡」主要为留守儿童、贫困地区儿童以及未能完全掌握普通话的学生所设计,为他们提供一个纯净的素养教育平台。「对于孩子来说,他们对世界的好奇心就像泡泡一样,在阳光下会折射出美丽的色彩。」

为了更好地激发3-6岁儿童的学习兴趣,团队决定用「泡泡」作为核心功能的形态。软件设置了「生活小能手」、「安全我最棒」、「蔬果故事会」三个版块,小朋友们可以在掌握生活常识、自我保护、健康饮食三个领域知识的同时提升普通话水平。

在整个跟读环节,「语言海洋泡泡」首先利用「一句话识别」功能对儿童语音进行转换识别,再利用「句子相似度」进行评判。产品还会根据孩子的普通话水平,智能匹配相应的学习音频,助力儿童高效学习普通话。

这种「开盲盒」的玩法确实极具吸引力:进入产品界面后,小朋友只需要选择其中一个泡泡,点击「收听」、「我来说一遍」、「点击再听一次」,就能完成跟读学习。

「语言海洋泡泡」这个项目希望通过科技的方式帮助孩子们边玩边学,在学习中提高说普通话的信心。在目前的功能中,任何用户都能够在「语言海洋泡泡」中提交新的泡泡,为丰富语料库贡献自己的力量。

神奇泡泡的最强技术助攻

从上半年开始,「语言海洋泡泡」产品得到了现任中共理塘县委常委、副县长(挂职)叶小明的支持。来自杭州钱塘新区的叶县,希望并认同用科技帮助孩子多说普通话。目前,「语言海洋泡泡」产品已在理塘县开展试点运用,当地越来越多的幼儿园已经加入到「语言海洋泡泡」的队伍里。

团队也提到,根据调查统计,85%以上的人对语音识别系统的功能表示满意。

理塘当地的小朋友正在使用「语言海洋泡泡」。

那么,这样一款寓教于乐的公益产品,是怎么打造的呢?在决赛路演中,团队成员分享了搭建「语言海洋泡泡」的过程。

实际上,几位成员之前并没有自然语言处理产品的项目经验。在这个过程中,腾讯云担任了「最强技术助攻」的角色,提供了关键的语音识别技术支持。

「语言海洋泡泡」的核心落地场景在于跟读过程的语音对比,在每一个泡泡下,都包含一条10秒之内的普通话教学语音。团队翻阅了很多学龄前儿童的书籍,收集到几千条可用素材,而这些语料也大多是团队成员自己录制的。

团队成员提到,基于腾讯云开放的「实时语音识别」和「一句话识别」两项功能,他们不再需要从零开始设计算法,直接调用API就能实现产品的语音识别功能,大大减少了项目手写代码的工作量。

于是,他们把精力主要放在了语料库的搭建上:尽管在最初录入的过程中,语料的总体识别精确度仅在80%左右。但经过一周内的语料库更新和多次测试,团队将精确度迅速提升到了90%以上。

从落地效果上看,目前中小词汇量非特定人语音识别系统识别精度已经大于98%,同时「一句话识别」与自然语言处理中的「语言相似度识别」功能已经非常成熟,精准度与稳定性均可得到保证。

此外,腾讯云的微搭平台提供了很多现成的行业化模板、拖拽式组件和可视化配置,即便此前完全没有接触过语音领域的工作,使用者也能快速融会贯通。

一位负责开发的成员表示:「这样一来,我们就可以把更多的时间放在产品功能的实现上,省去了代码上的很多基础工作。」

腾讯云提供的语音识别开发者资源。

按照团队成员们的规划,未来的「语言海洋泡泡」会包含更多有趣的功能,比如泡泡收藏、用户排行榜、排位赛等。同时,这款产品也会借助推荐算法,不断提高用户接收知识难度,比如说从简单的一句话进化为绕口令,帮助孩子们不断提升普通话水平。

目前,腾讯云的AI语音识别技术已经支持中、英、粤、川、韩、日等多个语种,涵盖通用、音视频、金融、医疗、游戏等领域。基于腾讯云开放的众多技术能力,团队也展开了更多想象,比如加入语言互通的功能,包括藏英、藏汉语言互通。

「或许三、四岁的小朋友还意识不到学好普通话的长远意义,但看到这些孩子能够开心地使用产品,能够边玩边学、真正有所收获,我们就很感动了。」团队成员表示。

技术有「深度」,更要有「温度」

围观了决赛路演全程之后,可以发现,所有入围决赛的选手都提到了一个关键词:腾讯云。

如「北辰之星」团队一般,借助腾讯云提供的各项技术能力,各个团队的成员们即使没有太多的技术经验,「一键调用」就能完成产品搭建。

比如「悦智AI实验室」团队开发了专注于新生儿黄疸识别的「保健熊」小程序,目前已植入广州市卫健委官方

转载请注明:http://www.0431gb208.com/sjszlff/1257.html