毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

AI专题这可能是关于人工智能最完整和

来源:语言识别 时间:2022/7/11

俞志晨团队开发的“图灵机器人”,其知识接受能力相当于七八岁小孩。

真正意义上的人工智能还很遥远,大众消费级别的即将强烈改变我们的生活。

本文首发于年5月刊

长久以来,科幻小说和电影为我们预设了太多关于智能机器人的想象:《太空漫游》里阴郁的哈尔、《A.I.》里悲伤的大卫、《星际旅行》里可爱的数据先生、《银河系漫游指南》中神经质的马文等等,以至于我们看不到那些正在进入我们日常生活之中的“人工智能”。从我们最常用的谷歌搜索引擎、苹果的语音助理Siri,到科幻色彩更浓的谷歌眼镜、无人驾驶汽车……它们既非能力超凡的机器人,也非让未来学家心醉神迷的超人工智能,但它们能感知周围的环境,从经验中学习,并自动做出决定,而且其速度与准确率往往超出我们的理解能力。在背后支撑它们的“智能”的,并非人类思维层面的智慧,而是廉价、可靠、工业级的数字智慧。

随着物联网的兴起,这种智慧正在被赋予越来越多原本沉默的日常之物,一个叉子能计算你的吃饭速度,牙刷能监控你的刷牙时间,鞋子能纠正你的走路姿势……与此同时,随着人类把越来越多的智能设备穿戴到自己身上,甚至植入皮肤之下,我们似乎不可避免地在向半人半机器的物种进化。于是,一个很关键的问题就变成,未来人工智能的软件和硬件将以什么样的形式交汇与整合?人与机器之间的关系又会因此发生什么样的变化?

人工智能已经存在了吗

“这取决于你认为‘人工智能’指的是什么。”李志飞坐在一张沙发上,春寒料峭的北京,会客室里却出奇的闷热,机房里庞大的机群轰鸣着,不断地制造热量。

李志飞是“出门问问”——一款“移动语音搜索”的创始人之一,他是美国约翰霍普金斯大学的计算机科学博士,专攻自然语言处理,在谷歌研究院从事机器翻译的研究和开发,三年前辞职回国,加入中关村的创业大军。他认为,有两种“人工智能”,一种是学术界定义的“人工智能”,即造出一台机器,能像人一样思考,具有与人相似的智力水平。很显然,目前没有一个机器具有这样的“智能”。

去年6月,一个叫EugeneGoostman的聊天机器人号称成功骗过了图灵测试三分之一的评委。但EugeneGoostman之所以能通过图灵测试,并非它真的会“思考”,而是借助于一些聪明的花招和诡计—它假装自己是一个13岁的男孩,诡称英语是自己的第二语言,以此解释语言中的不一致;当无法给出直接答案时,就通过虚张声势或装疯卖傻来转换话题。事实上,这在图灵测试的历史上已经成了某种惯例:图灵测试所测的与其说是机器思考的能力,不如说是扯谎的能力。

作为自然语言处理领域达到最高水平的机器,IBM的沃森在年的Jeopardy游戏中击败了所有的人类对手(Jeopardy是美国出名的电视问答游戏,问的问题涉及大量比喻、笑话、谜语),而且它的知识不是工程师手动编程灌输给它,而是自己通过阅读获得的。沃森每秒可以处理GB的数据,相当于1秒阅读万本书,但很可惜的是,沃森并不理解它所阅读的内容的任何含义。

年,“谷歌大脑”——一个由1.6万台计算机组成的网络系统,在随机分析了0万条YouTube视频之后,终于“认识”了猫是什么样的动物。这个机器被认为是当下人工智能领域(“深度学习”)一个里程碑式的进步,因为它是凭借自己的力量发现了猫的概念,没人告诉它猫是什么。据称他们是在控制论层面模拟了人类大脑视觉皮层的运作方式—神经学家认为,可能存在一种名为“祖母神经元”的细胞,当人被反复“训练”去识别某一张人脸时,这种细胞便会被激活。但这个网络与人类的视觉皮层相比仍然很渺小,后者的神经元和突触数量比该网络多万倍。更重要的是,谷歌的这个“猫侦察机”虽然号称识别准确率达到81%,但“一旦将样本量扩大到2万个类别,得分瞬间会跌至15.8%”。

“深度学习的确是一个有效的方法,”李志飞说,“但统计数据无法推导出所有东西,我绝对不相信深度学习能实现科学家的目标。”但是,他认为还有一种工程师定义的“人工智能”,它不需要有什么独立意识,或者情感,更不是未来学家如雷·库兹韦尔所宣扬的“奇点”,相反,它的存在只是为了扩展人类的智能,扩展一些我们以前无法实现的能力,比如谷歌刚刚收购的机器人公司BostonDynamics,他们生产的大狗机器人能翻山越岭,穿越冰雪,人用力踹它也踹不倒它。

李志飞毕业于普林斯顿大学,在创办

“出门问问”之前,他在谷歌翻译部门工作。与Siri相比,“出门问问”能理解更复杂,

更口语化的命令。

根据雷·库兹韦尔的预言,到年,机器将能做一切人类能做的事情,包括理解我们说什么,从经验中学习,听懂笑话,讲故事,调情等等,到了年,我们将迎来“奇点”:即人工智能超越人脑的时刻,届时人类,包括身体、头脑、文明在内,都将发生彻底且不可逆转的改变。

李志飞一听到库兹韦尔的名字,眉头就不由自主地打成了一个深V形,“库兹维尔是布道者,他会过度承诺,但不会给你一条路径。‘奇点’从来不告诉你先做什么后做什么以及怎么做,但作为工程师,我们需要一个实实在在的计划,一个可以着手迭代的产品,一点点发现问题,所有的工程都是围绕解决这些问题,而不是凭空想到某个东西,一下子就解决所有问题。”

作为科学家的李志飞很清楚,今天我们距离真正意义上的人工智能还有十万八千里。人类大脑是已知宇宙中最复杂的器官,我们甚至不知道它是如何工作的,更何况复制出人类大脑那种无穷威力?从某种角度来说,人工智能的确像是“一个想通过爬树爬到月亮上的人”;但作为工程师的他从一开始就没想去月亮,他想建造的是一个“大众消费级别的人工智能”。运气好的话,它也许会成为未来人类爬上月亮的一小节梯子。即使这节梯子最终被证明是指向错误的方向,至少我们知道了那是个错误的方向。

语音助理:当机器理解你的语言

在今年初极客公园创新大会的一次演讲中,李志飞清晰地提出了建造一个“大众消费级别”的人工智能的具体路径:首先,它必须是一个可交互的设备,要做自然语言的交互。第二,必须是随身携带的,每时每刻作为一个普通人都可以用得到的;第三,能够连接各种各样的传感器。

语言是人类认识世界最重要的手段之一,一个“聪明”的机器首先必须理解你的语言,可以与你做简单的对话。作为智能手机平台上的一个App,“出门问问”已经基本上可以实现这一点。

首先它能“听”,知道你到底说了什么,将声音转化为文字。“语音识别”作为人工智能一个重要分支经过多年的发展已经近乎完美(准确率可达90%多),但“听”的应用场景和如何优化却有很多变化,比如在地铁里和在一个安静的房间里听人说话是很不一样的。“这就是工程师做的事,每天都为具体问题做很多优化,慢慢去提升。”李志飞说。

然后是语义分析,即理解你话中的意思,这是目前人工智能领域最关键的技术之一。如果按照科学家的定义,机器理解人类语言,意味着机器必须对语言的产生有极为深入的了解:要理解语义、语法和构词法,要理解单词是怎么拼成句子、句子如何组成段落,还要理解词汇只是通往意义的载体而已。但事实上,过去60年来,计算机在自然语言处理领域取得的大部分进展都与这种层面的“理解”无关,而是基于一种“统计”的方法:庞大的数据加上精准的算法使得它们具备了惊人的模式识别能力(PatternRecognition)。

人们经常拿“出门问问”与苹果的语音助理Siri相提并论,后者曾被认为是数十年来人工智能领域最重大的突破之一。但在李志飞看来,Siri真正的突破不在技术,而是从产品的角度把人工智能从一项冷冰冰的技术推广到普罗大众中,让人们有兴趣去使用,人性化、好玩。但一旦你问一些比较复杂的问题,比如条件更多(“帮我查一下明天下午3点到5点从北京去上海的飞机”),或者句式更复杂(辣的不要),或者语义比较复杂(下星期二是几号),甚至是口语化(“帮我查一下明天去魔都的飞机”),Siri就没法应付了。

“我们跟GoogleNow更相似。”李志飞说。GoogleNow是谷歌于年推出的一款智能语音助理,与Siri的娱乐化倾向不同,GoogleNow更

转载请注明:http://www.0431gb208.com/sjszlfa/767.html

  • 上一篇文章:
  • 下一篇文章: 没有了