毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

智能机器人三大核心技术模块之一人机交互

来源:语言识别 时间:2024/9/9
治疗白癜风老专家 https://wapjbk.39.net/yiyuanfengcai/ys_bjzkbdfyy/790/
智能机器人三大核心技术模块:交互+感知+运控。其中,交互全称是人机交互及识别模块。这个模块功能主要包括语音合成、语音识别、图像采集、图像识别等。该模块主要涉及的硬件和软件有拾音器,喇叭,可见光机芯,红外热像仪,显示器,图像识别系统等。人机交互模块,百度词条定义:研究系统与用户之间的交互关系,提高系统的可用性和用户友好性。系统宽泛上指各种机器设备或是计算机化的系统和软件。用户可通过人机交互界面(可视化界面)与系统友好互动。通常机器人身上会安装一个显示屏,用户可通过显示屏与机器人互动,交换信息,这种体验就叫做人机交互。这里主要介绍识别模块中的语音识别和图像识别两个方面。语音识别主要经历以下过程:语音识别(AutomaticSpeechRecognition)、自然语言理解(NaturalLanguageUnderstanding)、自然语言生成(NaturalLanguageGeneration)、语音合成(TextToSpeech)、对话引擎(ConversationEngine)。简单来讲,听见你说什么,知道你什么意思,输出语音信息,进行对话。当然这里面还涉及到声音预处理,声音特征提取、声学模型,解码等等,这些内容有点复杂且理解较难,这里就不介绍了。另外语音识别模块有几个重要的组成部分:功放模块,控制器和识别系统。l功放模块:语音模块会收集各种声音后,通过功放模块让大众听到,使其接收和播放都灵活自如;l控制器:简单来讲就是控制语音识别模块的各种功能;l识别系统:识别声音或语音转文字等等。图像识别是指利用计算机对图像进行处理、分析和理解。识别各种不同模式的目标,对质量不佳的图像进行一系列的增强与重建。简单来讲就是眼睛和大脑的结合体,不仅是用眼睛看到,获取目标图片,更是要经过大脑分析出目标是什么,若图片质量不好,内容模糊看不清等,也可以利用图像技术改善图片质量。图像识别过程主要有:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。主要是获取目标信息,如光或声音等,之后再对图像进行去噪、平滑等处理,提高图像特征信息,然后针对图像内容进行特征选取和识别,最后设计分类器,设定识别规则,训练图片,达到较高的识别率。以上只是语音识别和图像识别的皮毛知识,未涉及到具体识别原理和过程,可以入门了解一下。

转载请注明:http://www.0431gb208.com/sjsbszl/7499.html