毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

语音搜索系统只是把问题录音过来,然后结合

来源:语言识别 时间:2024/12/4
以深度学习为代表的ai技术飞速发展,人工智能再次引领全球舆论,变革各行各业,语音识别、物体识别等各类更为精准的语音搜索和推荐问世,语音合成技术尤其是音色和音调分离等方式被广泛应用于广告、金融、教育、军事等各大领域。7月17日,融汇科技在广州展厅推出了广州先声科技开发的国内首款多轮对话推荐产品——mjonim多轮对话语音雷达。多轮对话雷达主要针对用户问答交互场景,这类场景下的用户问句可能存在着诸多虚实信息、虚假引导信息,并存在多轮语言信息错配问题,多轮对话雷达系统采集信息的精度和速度有极高要求。更为复杂的是,用户问答过程的每一轮对话均存在双方语言理解的隐性歧义性。对话雷达要在用户数据实时交互中进行自动分析,有效识别出适当的答案,让用户能更好地理解复杂对话内容,进而提供用户的购买决策,实现精准营销。截至7月底,我们在国内多家知名音频平台上已经顺利开发了条多轮对话雷达。此次推出广州先声开发的mjonim多轮对话语音雷达产品主要为广州先声多年积累的用户语音服务数据集打通提供支持,其中包括用户播讲的广州先声的音频雷达录音,用户对广州先声的语音访问权限,视频音频识别关键词库,音素分别匹配模型及识别模型等数据。通过此次mjonim多轮对话语音雷达产品的上线,用户在广州先声获取到的雷达数据将会更高质更广泛的提升每一轮广州先声的问答收益。尽管mjonim多轮对话语音雷达是首款支持国内大数据用户实时对话的产品,在广州先声系统中还有许多改进空间,但mjonim多轮对话语音雷达系统仍将充分利用广州先声各个平台大数据,在更多具有针对性的情况下加以应用,同时丰富其大数据服务场景,带给用户更优质的语音服务,促进大数据应用向语音服务的进一步渗透。未来语音搜索系统所有的语音都会通过ai来实现搜索,不管是苹果的语音搜索,谷歌的语音搜索,还是百度,本质上只是把问题录音过来,然后结合一些算法来给出答案。目前最真实,效果最理想的语音搜索应该是雅虎、谷歌的搜索,相比较之下,百度产品包括百度卫士什么的都相对来说小众,并不那么熟悉。楼上的同行们说得非常多了,其实各家在这个问题上也各有优劣势。最关键是掌握大数据方面可以取得优势。如果大数据优势不能继续发挥作用,那么靠算法来建立算法框架还是会继续下去。所以不用过于急躁,多想办法优化算法就好了。有足够大的数据支撑是非常棒的!未来语音搜索是一种新兴产物,本身和传统的搜索是没有本质区别的。

转载请注明:http://www.0431gb208.com/sjslczl/7973.html