毕业论文
您现在的位置: 语言识别 >> 语言识别优势 >> 正文 >> 正文

科大讯飞新一代唇音融合语音技术已加入智能

来源:语言识别 时间:2024/9/13
北京看白癜风专业医院 http://www.znlvye.com/

近日,科大讯飞在智能座舱创新技术论坛上分享了"面向智能座舱的多模感知技术及交互设计思考"的主题演讲,深刻表明座舱多模感知系统功能具备高精准率、高覆盖率、高效低本等优势特点。

据了解,科大讯飞此套座舱多模感知系统可分:驾驶员多模感知与乘客多模感知两个大方向。其中,驾驶员多模感知功能,包含多模语音、人脸识别、注视感知、驾驶员状态感知等功能。尤其是,在驾驶员状态感知,该系统不仅做了疲劳感知,还分别设定了分析感知、行为感知,以便在系统可对驾驶员状况进行充分的安全监测,从而进行自动提醒、调节车内状态,减少事故发生。

乘客多模感知功能,则可细分为身份识别、身份画像、儿童遗留感知、物品遗留感知、多模情绪、手势识别、乘客分布标记及危险行为感知等,同时,还使多模情绪具备了共情、交互等逻辑。

值得一提的是,科大讯飞此套座舱多模感知系统的多模语音、多模认证、多模情绪、多模画像等核心技术保障技术指标领先。其中,多模语音,更是应用到了科大讯飞首创的新一代唇音融合语音技术,基于讯飞大规模人脸库训练的红外异质FaceID技术,更是达到99.9%以上的准确率,复杂光线,嘈杂场景也可完成Yaw±90°,Pitch±45°和Roll±45°大角度姿态下的准确检测,同时还克服驾驶员佩戴眼镜、口罩、面部各种遮挡等复杂场景的影响。在纯软件技术方案,更是保持着不增加硬件成本,充分挖掘芯片性能的初衷。

除此之外,近年来科大讯飞还先后推出过智能汽车语音助理、智能车载系统等汽车智能化产品,为广大客户提供了全栈汽车人机交互和车联网服务产品体系,满足了市场差异化需求和用户的个性化需求。截至目前,其汽车智能化产品的合作已覆盖90%以上的中国主流自主品牌和合资品牌车厂,累计用户规模突破万。

今年五月,科大讯飞还与奇瑞签订了全面深化战略合作框架协议。据悉,本次双方合作范围覆盖了汽车智能座舱、智能音效、智能销服、国际多语种、智能驾驶、工业智能及企业数字化等七大领域。此次深化合作,将加快奇瑞企业自身的数字化转型进程,进一步向智能化、网联化转型升级。而对于科大讯飞来说,这则是其在智能汽车及车联网领域,又一步拓展品牌市场的能力印证。

而这正如科大讯飞邢猛所言:"从语音到多模一定是趋势"。未来,以人、车、厂为驱动的多模也必将迎来更多的新机遇与挑战。

转载请注明:http://www.0431gb208.com/sjszjzl/7551.html