毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

芝麻开门走进千家万户21世纪的语音识

来源:语言识别 时间:2022/9/17
中科医院专家 http://m.39.net/pf/bdfyy/zjft/

用声音做钥匙,可能是人类的千年梦想。在这个星球上,估计没有人不知道“芝麻开门”四个字,这虽然是传说故事,但如果用21世纪的眼光看,这就是正儿八经的语音识别技术。

在21世纪的今天,“芝麻开门”的技术或许很快就将走进千家万户。但想要实现语音识别的普及,难度比我们想象中还要大。

人类现在的身份识别方式,已经从最初的指纹识别,字迹识别,发展到人脸识别和虹膜识别,这是因为每个人的这些东西都有不同的特征。但一个人的声音是否有这种特性?“京中有善口技者”,在日常生活中不少人善于模仿其他人的口音,甚至真假难辨。

其实,一个人的声音也有相当丰富的信息量。世界上没有任何两个人的声道完全一样,从声道的长度到形状,尽管一个人可以模仿别的声音,但不可能完全一致,科学家把语音的这种特征叫做“声纹”。科学家曾找过数十对双胞胎进行实验,结果机器完全可以把他们区分开。这就为语音识别奠定了基础。

但还有一个问题,正如人脸识别需要眨眼和扭头一样,语音识别可没有这种验证方式,如果提前录好一个人的声音,能不能逃过系统的识别?显然,语音识别的“文本提示”技术,已经将这一漏洞抹平了。

相比其他身体特征,语音识别受到的干扰因素更多。如果一个人嗓子哑了,他发出的声音自然跟平时不同,当一个人无法表达自己的正常声音的时候,语音识别或许就会面临障碍。

信息时代,一个人的身份信息决定了太多东西,相比技术的进步,一些技术犯罪也在不断涌现,比如利用人脸识别技术进行的假体攻击,就曾多次见诸于新闻。指纹识别和人脸识别也有被人盗用的危险。可想而知,未来语音识别一旦普及,利用语音识别技术进行犯罪的事件也不会少。

怎么说呢,世界上没有%的安全,但相比指纹,人脸,虹膜等静态特征,我相信我们的声音会更加安全。大家怎么看?

转载请注明:http://www.0431gb208.com/sjsbszl/1578.html