毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

从视觉到听觉,语音技术的感官革命

来源:语言识别 时间:2023/7/26

2月17日报道(编译:罗彬杰)

编者注:本文的作者NithyaThadani是RAIN公司的首席执行官,该公司专注于语音策略、设计和开发。

“闭上眼睛,听我的声音。”这是冥想教练对刚开始练习冥想的人说的话。当我们需要集中注意力的时候,我们会关闭视觉输入,让我们的大脑来完成工作。

感官上的抑制可以从深层次上解放我们的思想。一些人类最伟大的创造者,从JohnMilton(英国文学史上伟大的六大诗人之一)到RayCharles(美国灵魂音乐家),在失去视力后反而迸发出强大的精神创造力,证明了即使是最丰富的精神体验也不需要我们的主要感官参与。视觉刺激的缺失可以打开认知可能性的世界,我相信这一真理支撑着人类与技术、人类彼此之间以及与世界的交互方式上发生的重大感官革命。

在我们进入一个新的十年之际,我们的集体经验比以往任何时候都更加直观。我们日日夜夜都盯着屏幕。在社交媒体上,我们越来越多地使用照片和视频,在写作时也常常限制文字和字数。

虽然视觉能力在我们的进化中处于核心地位,对引导我们在现实世界中活动很有帮助,但它在某种程度上已经成为影响我们注意力的致命弱点。大型互联网公司经常利用我们的眼睛来捕捉和维持我们的注意力,在很多情况下,它们还会颠覆我们的思维。

设备和数字媒体带来的危害已经不是什么秘密了。作为消费者,我们时长会感觉脖子僵硬,注意力分散,当我们远离电子设备时(或使用电子设备时)还会感到焦虑。事实上,许多正在打造令人上瘾的数字产品的科技行业领袖,往往是对自身风险最敏锐的观察者,这导致他们采取先发制人的行动,保护自己的亲人免受科技潜在负面影响的侵害。

作为一名领导者,我的公司每天都与最大的科技公司合作,因此无论是在工作中还是在家里,我都是这种紧张关系的直接受害者。多亏了我的智能手机,我的女儿比我想象的更接近她几百英里外的曾祖母。与此同时,当我们只有几英尺远的时候,这个设备拉开了我和她的距离。

因为我在语音技术领域工作,因此家里有很多语音助手——Alexa、谷歌助理、Siri等等。虽然出于职业原因,我可能是一个超级用户,但我并不是唯一一个这样做的人。据估计,到年,超过一半的美国家庭将拥有语音助手。

在过去的两年里,我观察到我的家人和朋友与语音技术互动的方式与基于屏幕的媒体有一种奇怪而深刻的不同。我女儿仍然经常与语音助手打交道,但语音不会像屏幕那样扰乱我的家庭。尽管移动设备和平板设备在设计上是个性化的,因此更加容易把人孤立起来,但声音却天生具有包容性和参与性。

我的女儿在做拼图游戏或和她的弟弟玩耍的同时,可以让语音助手播放一首歌或翻译一个西班牙语单词。同样地,如果她问了一个我回答不了的问题,我的新办法是找个语音助手陪她。语音技术并没有把我吸进设备的数字流沙中,而是像一张蹦床,把我弹回到现实世界。我的女儿不再是孤立的,我也不再是孤立的。

这些观察让我开始思考:是什么导致了我们在使用语音优先技术和屏幕优先技术时产生如此巨大的差异?

基于屏幕的技术之所以让人上瘾,是因为视觉在我们感官层次中的地位

我们先来看看是什么让移动设备从根本上分散了人们的注意力。不仅仅是屏幕的存在,事实上,许多语音设备也有屏幕,其中最重要的就是我们的手机。它是屏幕在设备的用户体验和我们作为用户的感官层次中所扮演的角色。“屏幕优先”体验,即屏幕是输入和输出的主要形式,会分散用户注意力,因为视觉输入是复杂的,而人类也不断进化为更多地从视觉中获取信息。

这是一种与生俱来的需要。人类的生存依赖于我们理解他人的能力。我们总是试图通过解读他人的情绪、举止和行为来理解动机和意图。大部分的社会感觉输入是视觉的(这也解释了为什么65%的交流是非语言的)。甚至从出生开始,婴儿观察和识别人脸的能力就比获取大多数其他信息要早得多。

屏幕优先设备利用了这种条件反射,想尽办法有条不紊地把我们的注意力吸引过去。推送通知的设计目标是利用我们大脑的执行功能,尤其是“自下而上”的大脑信号,它优先于我们有意识选择

转载请注明:http://www.0431gb208.com/sjsbszl/5448.html