AI声呐眼镜来了读懂唇语隔空操控手机

来源：语言识别时间：2024/1/20

编译

吴菲凝

编辑

李水青

智东西4月17日消息，近日，康奈尔大学未来交互智能计算机接口（SciFi）实验室发布了一款声呐眼镜EchoSpeech，该产品能根据嘴唇、面部肌肉的运动走向来识别无声命令。这款看似普通的眼镜使用了声学感应和AI技术，并配备两对扬声器和麦克风，目前可以连续识别多达31条“无声语音指令”，准确率高达95%。

EchoSpeech的主要应用场景包括嘈杂环境、不方便交谈的场合以及私密对话，还能帮助语言障碍者与他人进行交流，兼具商业消费和医疗保健功能。研发团队通过AI深度学习管道，来破译面部运动的声波传输轨道，利用卷积神经网络来解码无声语言。

此外，研发团队目前正通过资助项目Ignite来实现设备技术的商业化，未来将实现一定范围内的推广使用。

这篇名为《EchoSpeech：由声学传感驱动的眼镜上的连续无声语音识别（EchoSpeech：ContinuousSilentSpeechRecognitiononMinimally-obtrusiveEyewearPoweredbyAcousticSensing）》的论文本月将在德国汉堡举行的CHI（ConferenceonHumanFactorsinComputingSystems）计算机协会会议上发表。

论文链接为：

转载请注明：http://www.0431gb208.com/sjszjzl/6901.html

上一篇文章：有道翻译王20Pro体验懂43种语言,

下一篇文章：谷歌实时多语言语音识别研究成果AI算法