教AI认手语的年轻人
他们借助科技力量,试图让更多聋人被“听见”“听懂”
今年5月,世界智能大会现场,一个“手语角”吸引了不少人驻足。只要在摄像头前打出手语,身后的显示屏上就会出现语意连贯的文字翻译。这套由天津理工大学聋人工学院和计算机学院共同参与研发的“复杂场景下中国手语实时翻译系统”(下简称“手语实时翻译系统”),已经覆盖了教育、法律咨询、餐饮、交通几大应用场景,在光线充足稳定的室内,识别率最高能达到95%,部分场景下可以实现“秒翻”。
王建源是研发团队的成员之一。他是聋人家庭长大的聋儿,听力损失严重,吐字发声非常困难,手语是他和这个世界打交道最初也最有效的方式。一路长到22岁,聋人的身份不曾让他感到自卑;口不能言,也没耽误他长成一个妥妥的“学霸”;但如果你问他,因为听力障碍,从小到大遇到过哪些方面的不便,他会平静地在手机上打出四个字:方方面面——因为认识手语的人太少了。
一个最典型的例子是看病,如果没有手语翻译陪着,即便只是头疼脑热,像王建源这样的“手语族”也很难独自就医——绝大多数医生不会手语,你不能要求一个病人在急诊室里,用手写或打字的方式,条分缕析地快速描述自己的症状。
袁甜甜是王建源的老师,也是“手语实时翻译系统”项目团队的负责人。年研究生一毕业,她就在聋人工学院计算机系工作。15年来,袁甜甜记不清有多少次,凌晨一两点钟接到学院的电话,让她陪学生去看病,帮忙做手语翻译。如今,她已经是学院的副院长,医院依然是她和学院所有老师的职责。
她不怕辛苦,就怕自己的手语水平耽误事。袁甜甜是健听人(听力健全人的简称),手语是走上教职之后自学的,她常常自嘲说,在语言方面天赋有限,“我是个‘半颤子’(天津方言,指半吊子、不熟练)手语翻译。学生描述的情况一复杂,或者打手语的速度太快,我就只能看懂一部分了。”
听障大学生自立自强、想方设法克服身体上的不便,特教老师尽职尽责、苦练手语为残疾人事业无私奉献——如果要讲一个励志故事,这样的情节就足够了。但袁甜甜和王建源们显然更想讲一个“科幻故事”:他们想教计算机学手语,让机器代替人,成为随叫随到、及时准确的“手语翻译”。
袁甜甜学计算机出身,王建源的专业是网络工程,他们笃信,依靠科技的力量可以帮助中国万聋人,乃至更多有需要的人,克服生活上的种种不便。他们想让手语实时翻译系统化作一道桥梁,无论是听障者还是健听人,都可以通过它无障碍地交流。
这个目标听起来宏大,想实现也很难,但他们还是决定动手试试看。
新的桥梁
帮助聋人与健听人交流,前一座已经建成的“技术之桥”,是语音识别。
年,曾任中国聋人协会副主席的富志伟,发表了一篇题为《我看“聋人信息无障碍”》的学术文章。他在文中写道:“我期望将来能研制出一种机器,它可以和现在的微型摄像机一样大小,一端输入口语,另一端小屏幕上即显示文字……等到这种机器问世,聋人信息无障碍环境将大大改观。”
十几年后回看这段话,会发现富志伟期待中的机器,和如今智能手机上常见的语音识别应用,几乎一模一样。语音识别技术的受益者,也已不限于听障群体——看看身边有多少人在用语音输入法就知道了。
袁甜甜带领团队研发的“手语实时翻译系统”,就类似于手语版的“语音输入法”。只不过后者是输入语音、机器识别、转成文字,而前者是输入手语动作和表情、机器识别,再翻译成文字——“老桥”与“新桥”,相似又不同。
袁甜甜没想到,“老桥”的存在竟然会成为项目团队建设“新桥”的“阻力”。
“为什么一定要搞手语翻译呢?聋人听不到,现在有语音识别啊!有的聋人不会说话,拿手机打字不就行了吗?”曾经有一些企业向袁甜甜了解过正在开发中的手语实时翻译系统,想谈投资。但谈来谈去,他们却对项目的必要性产生了质疑,觉得手语翻译除了“做善事”没有其他意义。类似的话听得太多,快人快语的袁甜甜有点儿急了,“那要这么说,当初搞什么
转载请注明:http://www.0431gb208.com/sjszjzl/1400.html