雷锋网按:今天,在首届“JDD-京东金融全球数据探索者大会”上午压轴,京东集团副总裁、AI平台及研究部负责人周伯文和哥伦比亚大学客座教授,GraphenCEO林清咏、中科视托董事长山世光、微软亚洲研究院城市计算领域负责人郑宇、IBM中国研究院研究总监苏中、人工智能研究院院长颜水成进行了《探寻数据产业与AI发展之道》的精彩圆桌论坛,雷锋网编辑如下。
(雷锋网注:从左至右依次是周伯文、林清咏、山世光、郑宇、苏中、颜水成)
周伯文:首先,我们想来一个比较open的开放讨论,大家知道人工智能在今年非常热,也有来自与理论上,技术上最前沿的发展,像深度学习和大数据的资源以史无前例的速度进入了很多的行业。我想在座的都是研究人工智能的学术界和企业界的杰出人士。所以我想回到学术和技术本身,讨论一下从你们的角度来看
1.三个开场问题
我们目前的人工智能的现状和不足是什么?
第二点是接下来的五到十年在技术上最优可能的突破在什么地方?
第三点是把问题回到金融行业来,有这些预期的发展和突破,在未来五到十年包括现在的现状,金融方面我们人工智能巨大的机会是什么?
这三个问题可以在您的发言中选择性的回答也可以回答所有的。从我右边的年轻的教授开始,他也是我以前的老同事。
林清咏:谢谢伯文,我在哥伦比亚大学已经教了13年书了,我后来开始聚焦金融方面,过去两年前一直和全球的大佬们讨论AI和金融的关系,去年十月份的我去欧洲的一家银行,然后又给美国中央银行的年会,谈AI在金融方面的应用。IBM和全世界各大银行的CEO和总裁都去讨论什么是他们最痛的地方,常常讨论完了以后回来丢给我们的团队做,所以过去两年间累积了很多的经验。实际上在美国,或者是说全世界,大家都在将AI与金融结合。尤其是在华尔街的话,其实各个公司彼此都在竞争。军备竞赛就是在AI方面的竞赛。所以其实这就是现在的趋势,等一下我们可以再聊怎么做。我们在银行实践,一个礼拜到两个礼拜就可以取代以前人做的事情,接下来两个月时间把AI带进去以后可以做到他们以前没有办法想象,没有办法做到的东西,所以说在这个领域非常的活跃,所以我们决定自己出来,把这个机会扩张,也尽量的回到国内跟大家一起互动,跟国内的银行界和金融界有更多的关联。
谢谢林清咏教授,下面山世光研究员有什么看法?
山世光:非常高兴今天有机会跟各位讨论一下关于AI在金融领域的应用,刚才周总的问题,我想我重点的谈一下自己对于AI这个领域的现状以及存在的问题。因为我自己背景是做图像识别领域的,有大概20年的时间,可能最激动人心的时间真的是发生在了过去的两三年时间里。在这两三年时间里,得益于深度学习和我们能够拥有的大数据量,以及大规模的高性能计算的获得,使得我们在技术上有了非常大的进步。具体来说,一个简单的例子是我们在金融风控里面非常大量的采用人脸识别的技术,人脸识别技术在过去的三四年时间里,可以说在某些特定的场景下,它的准确率,或者是说我们反过来来讲它的错误率,其实有了我认为两到三个数量级的下降。也就是说我们过去可能会存在,像四年前五年前的时候我们的错误率会在1%这个量级。那么现在很多的运营商都是万分之一,甚至十万分之一这样的错误率的量级,可见,深度学习,大数据和高性能的计算给我们带来了一个巨大的进步。当然,这是一个例子,这是正面的例子。反过来讲的话,以目前这样一个大数据加上深度学习这样一个技术的组合使得我们有这样一个大进步,很多其他的领域还没有像我们想象的,或者是说公众所期待的,所盼望的大进步,特别是在一些数据量不是那么容易获得的场景下,AI的技术是比较小的,我们对比人做AI的智慧和智能的时候,我们很多时候不需要人做大量的数据,也可以非常快速的获得以图象识别为例去做固体的识别,一个简单的例子,小孩儿扔苹果,从来不会有哪一个家长给小孩儿一千个苹果扔,可能几个例子就好了。从这里来说的话,我们AI从方法论的角度来讲的话,我们还需要大量的利用,也许是利用我们数千年来积累下来的知识,再配合某种意义的小数据,知识加上小数据和推理等方法才有可能会有更大的进步。尤其是涉及到因果推理,即便是数据量非常大,从一个结果推导出什么原因产生这样一个结果,应该说现在的这种因果推理方面没有非常大的进步。我想我们可以一会儿做更多的讨论,我先介绍这些,谢谢。
是的,小样本学习和机器学习人工智能可检示性是接下来的热点和难题,我们看到了很好的进程,下面请你分享一下你的想法。
郑宇:我叫郑宇,来自于微软研究院,负责城市计算各领域的研发工作,通俗来讲微软做城市相关的技术,由我们组来负责,用大数据解决城市里面的交通、环境、规划、商业问题,最主要的例子是全世界三百多个城市的空气质量的分析和预测是我们组来完成的。我分享三个观点。第一个是AI的机会其实不在传统的IT行业,而是在和传统行业的结合,也就是说我们把AI和什么加在一起,加上交通、规划、金融等爆发的力量比传统互联网行业里面发挥的作用会更加的庞大,所以第一个观点,AI在传统行业里面加什么,拥抱传统行业和传统行业的知识结合。第二点是如果AI和金融结合的话,我们一定从一手高价值数据里面发现商业机会,很多年前大家做这个人工智能和大数据应用金融行业都会分析股票和期货,可是股票和期货的数据已经是三手数据,是别人经过多年沉淀以后的结果,真正的一手数据是我们现实生活中的周边也好,手机信号也好,记录也好,如何把一手信息进行有效的融合,这是在商业里面通过的一个制高点,而这里面需要大数据的融合技术,其实这个技术比较欠缺。第三点,真正AI遇到的瓶颈在哪里,我们觉得技术本身不是大问题,我们这帮科学家,未来这么多人传承接待总会做出来,但是人才的培养是一大困难。现在数据分析师不太难找,什么是数据分析师呢,他会用一些工具,你给他明确的数据和问题,他给你算一些结果出来,告诉你这个报表。但是真正的数据科学家能够把传统问题和人工智能算法对接,最后落地形成闭环的人其实非常少。我们做了很多年,感觉培养这样的学生非常困难,这种学生不是读五年书就会学会的,还需要各种实战和个人的感悟。根据我个人经验判断,培养这样一个真正意义的数据科学家可能需要七到十年,未来可以想想怎么样在人才培养的机制上做突破,如果没有这么多人才,说得再多,最后也很难真正落地,所以我就是这三个观点。
非常好,您的主要观点又懂AI,又懂具体业务场景的交叉结合是一个有很大需求的领域。所以跟在座的年轻的职业选择提供很好的建议。
鼓励大家成为数据科学家。
周伯文:当AI技术越来越强的时候对AI场景的定制化依赖是不是会减少,这个门槛随着AI技术的提高对应用场景的降低,这个你怎么看。
这是一个非常好的观点,为什么难就难在这里,我们懂数据科学的人对行业未必了解,对行业了解的时候,切入到另外一个场景又有很多新问题,需要快速的学习能力和提炼的能力,和需要已有的金融行业里面别人做的,做了什么工作,为什么好,为什么不好,如果东西只是比别人的结果好,别人不见得买你的账,知道别的结果和方法以后,用别人的语言去和别人沟通,这个东西是相互促进的过程,我们要拥抱传统行业,传统行业也要接近我们的科学,最后达到一个契合点。我们对我们自己的要求一定要提高,再提高。虽然我们是做研究的,但是要努力跨出去和企业合作,去拥抱传统行业,AI不是去替换任何一个传统行业,一定要拥抱一个传统行业,AI可以帮助我们降低对传统行业的知识和门槛,但是不代表说你不需要传统行业的金融知识。所以这是双方的一个结合。
谢谢。下面我们有请苏中讲讲您的想法。
苏中:很高兴见到伯文和林清咏,都是我以前的同事,今天的话题是AI,周伯文给了三个话题,一个是AI的现状,刚刚讲得特别好,AI在这一轮里迎来了很好的机会,我们在大数据的基础说有了很多的在数据上的训练的算法,在图像和语音和自然语言方面有很大的突破,我们从这个角度来讲,是在吸收大数据的红利,因为现在的计算的资源,尤其是存储和网络成本越来越低,我相信这个上面仍然有很大的空间要去提高。第二点就是说现在来看大数据,或者是说AI上面的挑战,我想刚刚虽然高老师说自然语言的理解或者是说人机交互已经是AI做得很好的一个方向了,我相信这个方向仍然有很大的余地或者是很远的路要走,原因是说在很多的时候,我们希望这个机器有智能的。现在大数据的智能,就像刚刚我们举的例子,给他一百万个苹果,让他识别,给他很多的东西。但是最终的结果是说它需要和人做自由的交互。那么语言,包括人的语言和书面的和各种各样的交流,其实是非常非常复杂的。这个里面,如果我们做得更好,我相信这是可能真正的一种强硬它的方式,就是说这个机器可以更好的理解人,可以跟人交互,从人的交互中,不光可以带来价值,同时也给我们心理上各方面带来很多的好处。我想这个方面应该有很长的路要走。最后从技术角度来讲的话,因为我也是做自然语言理解的,我觉得在这个方向上,我们其实有很多的机会可走,一个很重要的点是如何把结构化的知识和非结构化的内容能够结合起来,比如说我们看法律行业的工作,机器人算法能够更好的读懂论文和合同,以及法律文档。事实上你会发现行业里面已经定义了很好的数据描述,我们能够看到很好的数据之间参考,我们如何把现实中海量数据,以及包括人在上面的行为数据和知识体系能够结合起来,让互相之间能够促进,让结构化和非结构化的知识能够进行一个很好的结合。
非常好,您提到一个观点我非常赞同,可能也是我本人的研究背景决定的,您提到自然语言的理解对人工智能的交互很重要,因为我也是这么理解的,我们人类作为一个物种,人类的智慧和人类语言的能力基本上同步进化的。我想人工智能要发展到一个更好的阶段,对人类语言的深刻理解是一个不可逾越的门槛,也是下一个很有希望突破的领域。谢谢。我们下面有请颜总发表您的看法。
颜水成:好的,谢谢周伯文,我叫颜水成,其实我原来在学术界做了七八年,一个偶然的机会去国内的一家电子的商务平台公司帮助他们孵化了一个产品,就是你拍照,然后可以到平台上搜索你的衣服。这个公司很有意思,做这个产品的时候,有一个非常庞大的团队,很快做出来了。后来意识到在学校里面做AI的话,在工业界里面有它非常强的,非常好的产品,恰好有一个机会,希望组建人工智能的一个研究院,后来加入了奇虎,后来就正式变成了工业界的人士。对于人工智能的话,在过去这些年的发展,AI太大了,我觉得可能缩小一点来说——深度学习。深度学习在很多的公司来说是它当前的主要的驱动力,那么从这个深度学习的事情来说的话,我觉得当前的一种形式是说如果是在单模态的一个垂直场景的话,我觉得通过与工程师一起合力的话,落地和成功变得越来越清晰,如果我们跨过这个数据,要想在一个更通用的场景,现在的屏障是非常大的。
在将来的五到十年里,我觉得从深度学习的角度来说,在理论层面的话,就像今天高院士提到了一个行为主义,就是说我们可能需要像深度学习里面的,其实还是深度学习,但是把行为主义的思想用进来的话,这个模型的结构应该是在你的学习过程中是动态的更新,最后的话,会根据你的应用需要而智能的训练出它的形态,也就是说深度学习会从传统的特征学习和分类器学习,变成结构学习和特征学习,分类器学习合在一起来做,这是一方面,另外一个方面可能会有更好的优化的算法会迭出,让我们学术界或者是工业界可以在更短的时间内获得你希望得到的结果。我最近有一些反思,应用层面在技术角度来说是图像、语音、语意和大数据,大数据区分前面几个场景的特点是我们认为数据是表现出几个向量,有几句话的信息,不像语意和语音,我认为未来几年语义领域和语音的领域会越来越成熟,原因是几个方面,一个方面是市场上图像人才的量比较充分的,而且高校里面只看教授的话,有非常多的图像的团队,但是另外一个方面的话,其实还有两点,大家思考的不是特别多的,一个是说其实图像和大数据有一点不一样的地方是,当然都在用一些共性的数据,其实大家的数据差不多一样,没有自己独特的数据。这样的话比如说国家层面说要建立一个庞大的图像的库,即我要建立起一个庞大的语音库,这个库可以支持所有的图像和语音的公司。这是一个方面,从这个层面来说的话,可能经过一段时间之后,在图像和语音领域的话,这些公司就比较难以建立这个数据的壁垒,没有私有数据,其实大家都是一些共性或者是少量的个性化的数据。
另外一个方面是说其实图像和语音的应用也有它的特点就是---它没有应用的差异性,什么意思?你做一个模型之后的话,如果这个公司像沙老师的公司做得特别好,可能会支持中国的半壁江山都是可以的,没有问题。就是说从这个角度来说,图像和语音的话,可能在五到十年之后,会变得无论是人才还是应用级的话,会越来越成熟,甚至是在手机上变成平台级的厂商就可以做了,比如说苹果会把它自己的图像和自己的能力嵌入到他的手机里面,比如说像中国的华为和小米也很可能自己会有这种能力在里面。那么,大数据领域会是在后面的五到十年可以越来越hot,可以越来越吸引人才。也可以从两个维度来分析,一个方面是说大数据的方向的话,其实有它天然的数据壁垒,金融积累了很多的数据,也有一些私有数据是大数据方面的,不会分享给私有公司,这样的话没有办法建立起数据集,每家公司有独特的大数据,比较容易建立起大数据的壁垒。另外同样拥有私有数据,像用户行为的数据,就比较容易产生一种效果,就是说公司会有这个应用的差异性,如同样是做金融,京东的用户行为数据是不一样的,你需要有你的人来做这件事,你的模型拿到另外一家公司不是马上就可以用的。这个层面来说人工智能经过五到十年的发展之后的话,图像和语音领域会越来越成熟,人才也会越来越完备。但是具体的大数据的领域的话,对于人才的需求和行业的发展潜力,我觉得会越来越大。会涌现越来越多的公司。我就分享这些。
谢谢大家,大家都是行业内的专家,所以对于这个话题我知道你们都非常的有感触,如果我不限制时间你们可以一直讲下去,我觉得听得很过瘾,但是还觉得不够过瘾,为什么?因为你们还没有讲到具体的跟金融结合方面的想法。所以我来推动一下。
2.关于人工智能+金融的结合
我们都知道金融行业里面风险控制可以说是一个永恒的话题。可以讲整个金融是风险控制的一个主题。从人工智能,大数据的角度来讲,过去的几年中,包括我们京东金融在内做了很多的非常好的,关于这个贷前风险预估的模型的工作,用大数据和人工智能可以不用跟人见面就能很好的评估这些风险。今天换一个方向,我们贷后的风险,用人工智能和大数据能够做一些什么样的工作。比如说我们贷款贷出去给某一个客户了,我们发现他失联了,找不到了。这种情况下目前人工智能和大数据能给我们带来什么样的启发和思路,也请大家对这个具体问题发表一下意见。有没有哪一位嘉宾自告奋勇,可以从林教授开始,我知道你在这个方面研究很多。
金融界里面的贷款问题,尤其是贷后,这是一个蛮大的事情,去年单单是第一季度的工商银行的不良贷款,就达到了亿个人民币,这是一个季度很大的亏损,虽然是全世界第一大行,但是也没有办法经得起这样的亏损,所以贷后的问题,如何去预测一个企业会不会出状况,这是全世界银行都关心的问题,因为银行之所以赚钱就是因为贷款,他们要赌,要知道风险,这是一个相当严重的问题。那么,我们去年实际上就是我的团队从纽约到北京和上海,针对国内的数据来做这样的预测。基本上我们就发现以我们AI的能力,或者是说以前我的团队是美国政府资助我们几个亿的资金建立一个像脑这样的系统,包括不仅是深度学习,还有理解和刚刚托马斯·桑德霍姆讲的训练能力等。我们根据这样的整个全部脑的功能的系统,把它带过来,带过来的话基本上可以把这个贷后的不良贷款预测,可以把原来不到20%的准确率提升到大概接近60%。我们可以看到AI还有很多的问题是金融界关心的。比如说证券业,还有国家最关心的洗钱问题,因为洗钱
转载请注明:http://www.0431gb208.com/sjslczl/5113.html