毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

AI智能语音识别算法下篇

来源:语言识别 时间:2024/12/4
北京治疗白癜风最有效医院 http://baidianfeng.39.net/
一、神经网络当前常用的语音识别框架如下图其背后的逻辑是在特征提取时采用的神经网络里面的DNN技术深度神经网络DNNDNN技术可以分为两种,一种是CNN模型,一种是RNN模型卷积神经网络CNN模型循环神经网络RNN模型二、解码器解码器信息来源于声学模型、词典、语言模型。框图如下:2.1声学模型常用的声学模型为GMM-HMM,即混合高斯模型-隐马尔科夫模型HMM模型对时序信息进行建模,在给定HMM的一个状态后,GMM对属于该状态的语音特征向量的概率分布进行建模。2.2词典字典:就是发音字典,中文中就是拼音与汉字的对应,英文中就是音标与单词的对应用途:根据声学模型识别出来的音素,在字典中来找到对应的汉字(词)或者单词,用来在声学模型和语言模型建立桥梁,将两者联系起来。比方如下词语的映射表:2.3语言模型语言模型是针对某种语言建立的概率模型,是用来计算一个句子的概率的概率模型。划分以下两种:2.3.1N元统计语言模型:N-gram模型、平滑化2.3.2神经网络语言模型:与统计语言模型不同的是,神经网络语言模型不通过计数的方法对nn元条件概率进行估计,而是直接通过一个神经网络对其建模求解。用途:1、决定哪一个词序列的可能性更大2、已知若干个词,预测下一个词例子:1、Iwenttoaparty.Eyewenttwoabartea.2、你现在在干什么?你西安载感什么?

转载请注明:http://www.0431gb208.com/sjsbszl/7967.html