毕业论文
您现在的位置: 语言识别 >> 语言识别优势 >> 正文 >> 正文

AI声呐眼镜来了读懂唇语隔空操控手机

来源:语言识别 时间:2024/1/20
编译

吴菲凝

编辑

李水青

智东西4月17日消息,近日,康奈尔大学未来交互智能计算机接口(SciFi)实验室发布了一款声呐眼镜EchoSpeech,该产品能根据嘴唇、面部肌肉的运动走向来识别无声命令。这款看似普通的眼镜使用了声学感应和AI技术,并配备两对扬声器和麦克风,目前可以连续识别多达31条“无声语音指令”,准确率高达95%。

EchoSpeech的主要应用场景包括嘈杂环境、不方便交谈的场合以及私密对话,还能帮助语言障碍者与他人进行交流,兼具商业消费和医疗保健功能。研发团队通过AI深度学习管道,来破译面部运动的声波传输轨道,利用卷积神经网络来解码无声语言。

此外,研发团队目前正通过资助项目Ignite来实现设备技术的商业化,未来将实现一定范围内的推广使用。

这篇名为《EchoSpeech:由声学传感驱动的眼镜上的连续无声语音识别(EchoSpeech:ContinuousSilentSpeechRecognitiononMinimally-obtrusiveEyewearPoweredbyAcousticSensing)》的论文本月将在德国汉堡举行的CHI(ConferenceonHumanFactorsinComputingSystems)计算机协会会议上发表。

论文链接为:

转载请注明:http://www.0431gb208.com/sjszjzl/6901.html