智能机器人三大核心技术模块之一人机交互

来源：语言识别时间：2024/9/9

治疗白癜风老专家 https://wapjbk.39.net/yiyuanfengcai/ys_bjzkbdfyy/790/
智能机器人三大核心技术模块：交互+感知+运控。其中，交互全称是人机交互及识别模块。这个模块功能主要包括语音合成、语音识别、图像采集、图像识别等。该模块主要涉及的硬件和软件有拾音器，喇叭，可见光机芯，红外热像仪，显示器，图像识别系统等。人机交互模块，百度词条定义：研究系统与用户之间的交互关系，提高系统的可用性和用户友好性。系统宽泛上指各种机器设备或是计算机化的系统和软件。用户可通过人机交互界面（可视化界面）与系统友好互动。通常机器人身上会安装一个显示屏，用户可通过显示屏与机器人互动，交换信息，这种体验就叫做人机交互。这里主要介绍识别模块中的语音识别和图像识别两个方面。语音识别主要经历以下过程：语音识别（AutomaticSpeechRecognition）、自然语言理解（NaturalLanguageUnderstanding）、自然语言生成（NaturalLanguageGeneration）、语音合成（TextToSpeech）、对话引擎（ConversationEngine）。简单来讲，听见你说什么，知道你什么意思，输出语音信息，进行对话。当然这里面还涉及到声音预处理，声音特征提取、声学模型，解码等等，这些内容有点复杂且理解较难，这里就不介绍了。另外语音识别模块有几个重要的组成部分：功放模块，控制器和识别系统。l功放模块：语音模块会收集各种声音后，通过功放模块让大众听到，使其接收和播放都灵活自如；l控制器：简单来讲就是控制语音识别模块的各种功能；l识别系统：识别声音或语音转文字等等。图像识别是指利用计算机对图像进行处理、分析和理解。识别各种不同模式的目标，对质量不佳的图像进行一系列的增强与重建。简单来讲就是眼睛和大脑的结合体，不仅是用眼睛看到，获取目标图片，更是要经过大脑分析出目标是什么，若图片质量不好，内容模糊看不清等，也可以利用图像技术改善图片质量。图像识别过程主要有：信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。主要是获取目标信息，如光或声音等，之后再对图像进行去噪、平滑等处理，提高图像特征信息，然后针对图像内容进行特征选取和识别，最后设计分类器，设定识别规则，训练图片，达到较高的识别率。以上只是语音识别和图像识别的皮毛知识，未涉及到具体识别原理和过程，可以入门了解一下。

转载请注明：http://www.0431gb208.com/sjsbszl/7499.html

上一篇文章：支持多种方言语种的语音输入黑科技

下一篇文章：百度输入法语音功能体验,方言自由说成最大