今天我想说的话题,是数据和智能之间的关系。
我们首先来看一个汽车自动驾驶的例子。现在自动驾驶这个名词已经炒得很火热,但实际上这是一个非常老的话题。美国卡内基梅隆大学有一个项目-AlvinProject,目的是做一个自动驾驶的车,年已经成功地把车从东海岸开到西海岸,全程公里每小时的速度,基本上是自动驾驶。大家也许会觉得疑惑,为什么一个20年就已经成型的技术直到现在才开始商业化?实际上一个重要的原因就在于数据的问题。早期做自动驾驶,收集的数据非常少,大概只有几十个小时的驾驶数据,对复杂路况的处理能力比现在低很多,安全性不够。今天的厂商可以收集几十万小时的驾驶数据,而且数据处理能力很强,能让车在非常复杂的情况下具有良好的处理能力。从这个意义上来讲,大数据很重要。另外的例子是Google的AlphaGo。很多年前IBM的DeepBlue(深蓝)是非常成功的例子,他制作了一套系统能够跟国际最好的象棋大师做对弈。而AlphaGo系统里的深度学习、强化学习等,实际上在20年前已在游戏中应用。
年有一个系统叫TD(λ)的算法,有几位科学家把这个算法应用在一个在美国挺流行的游戏上,很快成为了世界冠军。
更神奇的地方在于,AlphaGo需要读人类棋手的棋谱,从中吸取经验成长成为世界顶级的选手,但是对于TD(λ)的算法来讲,当时做了两个不同版本的算法,这两个版本自己跟自己下了万盘,就成了世界冠军。某种意义上讲,是自学成才的算法。那么为什么AlphaGo系统大部分的核心技术点,实际上在20年前都已经很成熟,直到今天面纱才被揭开?关键还是数据问题。20年前的计算机不足以处理这么多的数据,而现在可以。还有一个比较重要的点是语音识别技术。近几年这项技术有了突飞猛进的发展,智能手机普遍应用语音交互。但实际上语音识别技术是从60年代开始的。很多技术很早就有人尝试,而近两年获得成功,归结于数据处理能力和计算能力,使得它能够变成更加智能化的工具。
数据有一个非常厉害的能力就是挖掘价值。以花呗为例,花呗的背后实际上是个人的信用分,这个信用分基于个人以前的整体行为,把所有的交易行为都形成数据,数据会告诉系统个人有多大的可能还钱或者有多大的还付能力。这个跟美国以前的信用体系有非常大的差别,完全从数据上挖掘行为,测量信用。
另外一方面,很多顾客会转载请注明:http://www.0431gb208.com/sjszlff/320.html