技术底座:对话式AI产品的AI技术底座由智能语音、自然语言理解与知识工程核心支撑
智能语音:在对话机器人产品中,智能语音技术主要应用于语音机器人与视频机器人/数字人产品的对话交互,由语音识别(ASR)与语音合成(TTS)两部分组成。从工作流程来看,用户真人的语音会先通过ASR(语音识别)技术将其转化为文本,再接入NLU(自然语言理解)进一步理解用户意图。因此,语音识别准确率至关重要,决定后续自然语言理解效果
自然语言理解:自然语言处理技术主要包括自然语言理解(NLU)与自然语言生成(NLG)两部分。对于对话机器人来说,如何做好自然语言理解(NLU)中的意图识别,是保证人机交互效果的关键。当下意图识别已达到相对优质水平,但对于情绪的理解与判断仍是难点
知识工程:知识工程已从早期单一FAQ技术发展丰富到深度学习FAQ、表格知识库、知识图谱、文档阅读理解等多技术阶段。从客户端体验来看,厂商将持续追求知识工程技术的丰富升级,
而从自身经营来看,厂商需基于投入产出判断是否开发新的知识工程技术
二、对话式AI产品的技术底座三大AI技术底座:智能语音、自然语言处理、知识工程
对话式AI产品的AI技术底座由智能语音、自然语言理解与知识工程核心支撑。在工作流程中,智能语音技术分为语音识别(ASR:AutomaticSpeechRecognition)与语音合成(TTS:Text-To-Speech)两类,实现对话内容从语音到文本、从文本到语音的相互转换;自然语言处理可分为自然语言理解(NLP:NaturalLanguageProcessing)与自然语言生成(NLG:NaturalLanguageProcessing),其关键是要让机器人“理解”人类语言中的意图并基于知识库“生成”对应的自然语言,完成人机对话交互;知识库为对话式AI产品的大脑,由知识工程支撑建设。现知识工程以深度学习FAQ为核心应用,另包括表格知识库、知识图谱和文档阅读理解等技术。
三、智能语音技术语音识别准确率至关重要,决定后续自然语言理解效果
在对话机器人产品中,智能语音技术主要应用于语音机器人与视频机器人/数字人产品的对话交互,由语音识别(ASR)与语音合成(TTS)两部分组成。从工作流程来看,用户真人的语音会先通过ASR(语音识别)技术将其转化为文本,再接入NLU(自然语言理解)进一步理解用户意图。因此,智能语音技术中的语音识别准确率至关重要,转换的正确与否直接决定了后续自然语言处理的效果。现阶段,语音识别的效果与成熟度已达到了相对先进的水平,对话式AI厂商正从VAD静默检测、ASR声学模型与ASR语言模型三部分入手,对应突破各部分的技术难点,以进一步提升语音识别的准确率。
四、自然语言处理技术意图识别已达到相对优质水平,情绪的理解与判断仍是难点
自然语言处理技术主要包括自然语言理解(NLU)与自然语言生成(NLG)两部分。对于对话机器人来说,如何做好自然语言理解(NLU)中的意图识别,是保证人机交互效果的关键。根据业内专家普遍反馈,目前意图识别的应用效果良好。
虽然对话机器人尚难做到人与人之间的理解程度,但人在知道是在与机器人交互时后,表达会相对标准化,因此意图识别的实际效果会普遍优于预期。而在情绪的判断与理解上,对话机器人仍有很长一段路要走,这也是未来可给行业带来技术突破与产品颠覆的方向。
五、知识工程技术提升知识库运营建设能力,基于投入产出评估新技术开发
知识工程已从早期单一FAQ技术发展丰富到深度学习FAQ、表格知识库、知识图谱、文档阅读理解等多技术阶段。从客户端体验来看,对话式AI厂商将持续追求知识工程技术的丰富升级,根据客户的业务及资料特点为其匹配合适的知识工程技术,将知识库的建设质效最大化;从厂商自身经营来看,厂商需基于投入产出判断是否开发新技术。以知识图谱为例,知识图谱可支撑多知识点的综合判断,提升对话式AI产品在复杂问题下的答案准确度,但知识图谱同样存在技术门槛高、开发投入大等特点,厂商需根据所需投入与业务落地价值,去评估是否投入开发,并选择判断合适的行业切入点。
转载请注明:http://www.0431gb208.com/sjsbszl/6534.html