9月1日,在“年百度世界大会”上,百度公司创始人李彦宏说三年前的百度大脑已经具备两三岁孩子的智力,而现在则具备四个方面的能力:语言、图像、自然语言、用户画像。
百度大脑的三个组成部分今年6月份,我在百度联盟峰会上讲了一个概念,叫做互联网的下一幕。就是说,在此之前互联网的发展已经经过了两个非常重要的阶段,第一个阶段是PC互联网阶段,第二个阶段是移动互联网的阶段。对于中国市场来说,随着上网渗透率越来越高,现在已经达到了七亿多,超过了50%的渗透率。现在每一个上网的人也都用上了智能手机,这意味着未来互联网的增长不能再靠人口红利来驱动了,其实移动互联网的时代正在离开我们。
现在我们国家进入了所谓的新常态,经济的增长需要靠“互联网+”行动计划来推动,“互联网+”就是希望用互联网的思维方式和效率来推动各个行业、产业的继续发展。但是互联网的从业者有了危机感,因为过去粗放的阶段已经被接受。
移动互联网之后的下一幕是什么?其实现在已经很清楚了,就是我们所说的人工智能。人工智能是百度核心中的核心,过去百度花了很大的精力投入到人工智能,这对百度意味着四个字——百度大脑。三年前,我们对外讲过百度大脑已经具有两三岁孩子的智力,今年人工智能火起来了,又很多人问我百度大脑现在多少岁了?其实我也不知道,因为人脑和电脑还是有很大区别的,百度大脑和人的发育过程是不一样的。
百度大脑有三个组成部分,第一个是人工智能的算法,模拟人的神经元网络,我们已经使用了万亿级的参数,人脑是千亿级的;第二个组成部分是计算能力,现在我们使用了数十万台服务器,不是基于CPU的服务,而是GPU;第三部分是数据,我们搜集了上万亿的网页内容,包括视频、音频、图像数据,每天数百亿次的网民定位请求。有了这三个组成部分,百度大脑就可以开始工作了。
百度大脑的四个功能今天重点介绍百度大脑的四个功能——语言、图像、自然语言、用户画像。
语言现在进入了比较成熟的阶段,识别的准备率很高,图像也是,属于人工智能的认知部分。自然语言的理解和处理更加难,除了认知能力,还要有推理和规划、用户画像的能力,从传统意义上讲,并不是人工智能的领域,但现在很多互联网公司有这个能力,把人描绘得非常清楚,这也是百度大脑的功能之一。
具体来讲,语言分成两个方向,一个是语言合成,一个是语音识别。百度已经把语音识别引擎技术准备率做到了97%,可当你有了这些准确率可以在哪些领域运用?我们举一个电话销售的例子,很多公司都有电话销售部门,但是销售行业流动性大,很多销售都是新来的,需要一段时间的培训,有经验的销售和一般的销售在效率上也有很大的差别,那怎样让新手能具备优秀的销售能力?过去就是把他的经验总结下来,让新的销售去背,但有了高精度的语音识别之后,就能改变这种状况,让新的销售具备这种能力,用语音识别总结客户的问题,再告诉新的销售,有经验的销售是怎么回答问题的。这是语音识别应用在企业中,它还有很多功能可以想象。
还有一个是语音合成,今天语音合成和过去有很大的不同,它可以用人的方式把文字读出来,我们现在每天响应2.5亿次的语音请求,比如过去是看小说,现在是听小说。这种读小说和广播有什么不同?广播每个人听到都是一样的,语音合成是可以定制的,具备自然发声能力,能模拟一个自然人的表达方式。比如百度地图的语音导航,里面的话我没有说过,只是根据我平时说话的声音合成。有了这些功能,那么每个人都能拥有属于自己的声音模型。
图像是人工智能非常重要的一个领域,说到图像识别就想到人脸识别,现在准确率已经达到99.7%。人脸识别是怎么实现的?我们先对人脸的关键点连接做一个处理,当一个人的表情发生变化时,我们依然能识别他。除了面部识别,还有地图里的实景图,到今天的识别力也是很高了。另外,还有一个很重要的领域也是非常需要图像识别的,就是无人驾驶汽车,无人驾驶汽车涉及很多技术,需要计算机视觉、环境感受、传感器融合、语音对话、规划决策、行动控制等,图像识别是最后的一项功能。
去年我们展示过百度无人车试驾,过去我们花了很多精力在城市道路的运营上。我们现在按照国际标准进行车辆的检测,百度已经排到第一了,就是车辆跟踪六项指标四项第一。今年八月份KITTI评测的最新成绩显示,百度无人车在车辆检测中排名第一,车辆跟踪6项指标中取得四项第一。
第三是自然语言处理,它的成熟程度应该不如语音,甚至不如图像识别,但是即使在目前的状态下,它也能够给大家带来很多很多不一样的体验。比如是去年百度世界大会的度秘,个人手机助理,除了它能够识别语音和图像之外,它更关键、更核心的技术是能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,尽管不是每一次都能理解。
第四个是用户画像,现在我们已经有十亿的用户画像,其中对他们的识别我们已经用到了千万级的标签,我们用两个方向,第一个是在垂直画像,一个是通用画像。有什么作用?例如手机百度用了百度用户画像,资讯推荐阅读量过去两个月增长了十倍,这是靠百度对用户打了六十多万个用户标签,而每个用户都是这其中某些标签组合后描画出来的,它可以做到万人万面,亿人亿面,每个人对于百度来说都是不一样的个体,所以每个人看到的信息和文章都是不一样的。
本文内容为9月1日李彦宏在“年百度世界大会”上演讲,略有删减。
预览时标签不可点收录于合集#个上一篇下一篇