芝麻开门走进千家万户21世纪的语音识

来源：语言识别时间：2022/9/17

用声音做钥匙，可能是人类的千年梦想。在这个星球上，估计没有人不知道“芝麻开门”四个字，这虽然是传说故事，但如果用21世纪的眼光看，这就是正儿八经的语音识别技术。

在21世纪的今天，“芝麻开门”的技术或许很快就将走进千家万户。但想要实现语音识别的普及，难度比我们想象中还要大。

人类现在的身份识别方式，已经从最初的指纹识别，字迹识别，发展到人脸识别和虹膜识别，这是因为每个人的这些东西都有不同的特征。但一个人的声音是否有这种特性？“京中有善口技者”，在日常生活中不少人善于模仿其他人的口音，甚至真假难辨。

其实，一个人的声音也有相当丰富的信息量。世界上没有任何两个人的声道完全一样，从声道的长度到形状，尽管一个人可以模仿别的声音，但不可能完全一致，科学家把语音的这种特征叫做“声纹”。科学家曾找过数十对双胞胎进行实验，结果机器完全可以把他们区分开。这就为语音识别奠定了基础。

但还有一个问题，正如人脸识别需要眨眼和扭头一样，语音识别可没有这种验证方式，如果提前录好一个人的声音，能不能逃过系统的识别？显然，语音识别的“文本提示”技术，已经将这一漏洞抹平了。

相比其他身体特征，语音识别受到的干扰因素更多。如果一个人嗓子哑了，他发出的声音自然跟平时不同，当一个人无法表达自己的正常声音的时候，语音识别或许就会面临障碍。

信息时代，一个人的身份信息决定了太多东西，相比技术的进步，一些技术犯罪也在不断涌现，比如利用人脸识别技术进行的假体攻击，就曾多次见诸于新闻。指纹识别和人脸识别也有被人盗用的危险。可想而知，未来语音识别一旦普及，利用语音识别技术进行犯罪的事件也不会少。

怎么说呢，世界上没有%的安全，但相比指纹，人脸，虹膜等静态特征，我相信我们的声音会更加安全。大家怎么看？