毕业论文
您现在的位置: 语言识别 >> 语言识别市场 >> 正文 >> 正文

给二次元虚拟主播配音,离不开这个无处不在

来源:语言识别 时间:2023/6/26

语音输入法的应用,将人与机器的交互问题变得更为简单智能。如今,语音技术已经充分融入了我们的日常生活,除了传统的家电行业,还可以应用于助听器具、给二次元虚拟主播配音、甚至是抓电信诈骗的不法分子等众多场景。语音识别都有哪些核心技术?又有什么具体的应用场景?

出品:格致论道讲坛

以下内容为中国科学院声学研究所研究员李军锋演讲实录:

大家好,我是来自中国科学院声学研究所的李军锋,主要从事智能语音研究。今天和大家分享的题目是《大数据时代的智能音频》,主要是我在智能语音技术领域的一些研究和想法。

已经进入千家万户的智能语音技术

语音技术研究其实已经有了几十年的历史,直到现在,大家才对这个领域和技术有了更深入的了解。

年,苹果手机上推出了Siri系统,让大家能够对着手机说话,实现了语音输入的功能。这是一个很简单的功能,但正是因为这个简单的功能,让语音技术走入了我们的日常生活。

我们所熟知的智能语音

我们国内的各大厂也紧随其后,开始做中文的语音输入。如果原来我们要查个东西,需要在电脑上打字来搜索,现在都可以通过语音输入来搜索。

Siri和其他各大厂的语音输入法的应用,把人和机器的交互变得更加智能、更加简单。但是,我们人类对美好生活的向往和追求是无止境的。所以下一个问题就是,如果我不是一直拿着一个手持式设备,而让它离得远一点儿,能不能实现类似的功能呢?

其实在Siri推出之后,很多厂商已经开展了进一步的研究,研发不需要手持的设备。到了年,亚马逊就推出了Echo音箱。我们国内大概是在年开始爆发,大家可以看到,几乎所有我们能想到的大厂都开始做智能音箱。

智能音箱

现在的智能音箱,不仅能听会说,还要会看,有了带屏幕的智能音箱。不需要手持,可以离说话人三五米远就实现语音智能交互功能。据我了解,我周围的很多朋友家里都有很多个智能音箱,而且这几年智能音箱的价格特别低,所以大家都可以拿来试一试。

智能家电

更有意思的是,很多厂商把智能语音技术用到了传统的家电行业。比如说智能电视、智能冰箱、智能空调和智能洗衣机,甚至还有人把智能语音技术用到了抽油烟机上。

我们团队在年的时候,就率先和海信合作,推出了智能语音电视,实现了用户离电视机三五米远,也可以用语音来操控电视的功能。

现在我们已经感觉到,语音技术好像无所不在,真正融入了普通老百姓的日常生活当中。

智能语音技术如何实现人机对话?

智能语音技术的核心,包括下图中的若干个大类。

智能语音技术的核心

麦克风采集到的信号不仅是目标的语音信号,还包括各种各样的噪声、混响等干扰。如何从这种信号里把目标语音信号提取出来,这就是智能感知技术。

提取出来目标语音信号之后,会送给后面的语音识别,实现从声音到文字的转化。

转成文字之后,需要识别这些文字是什么意思,这就是紧接着的自然语言处理。

经过处理之后,在很多的应用场景里,比如想要查天气、查机票和订机票,这些都还需要大数据分析。

大数据分析的结果会反馈成文字,如果要形成对话,还需要把文字变成声音的语音合成。

这就形成了一个完整的智能语音人机对话的链路,也是目前很火的智能语音技术包括的所有核心技术。

我们这个团队成立于年,是由颜永红老师一手办起来的。最开始颜老师是做语音识别,经过20年的发展,现在我们逐步发展到了包括语音感知、语音识别、自然语言处理、大数据分析和语音合成等智能语音交互链路的所有方向。逐步成为了国内乃至世界范围内,在这个领域具有影响力的一支团队。

接下来我和大家分享一些我个人的小案例。

智能语音感知技术成为“降噪刚需”

第一个是语音感知。对于语音感知技术而言,我们一直要解决的一个问题就是鸡尾酒会效应问题。大家可以先听一下这个声音。

在这样一个很嘈杂的环境当中,对于人类而言,我们还是比较容易

转载请注明:http://www.0431gb208.com/sjszlff/5173.html