摘要:在人工智能领域,阿里似乎不是一个很「显眼」的大玩家,然而事实真的是这样吗?
年4月9日0点04分,《我是歌手》第四季总决赛在湖南卫视落下帷幕,赛前被广泛看好的CoCo李玟夺得了总冠军。但当天,我们在记住了李玟的歌声以外,还被另一个意外出现的事件所吸引,那就是阿里云小Ai。
虽然在赛前它们给出的预测结果宣称韩国歌手黄致列将会夺冠,这与最后的结果并不相符;但随着比赛的激烈进行,各种数据和信息都在发生着变化,在第一轮淘汰之后的几次预测中,阿里云小Ai都表现出了比较精准的结果,并且在最终的三选一中成功预测到了李玟的夺冠。
4个月之后,在8月的阿里巴巴云栖大会上,这个一战成名的人工智能程序也进行了改版升级,变身成了「阿里云ET」。
但相比于竞争对手百度在人工智能领域的频频发声,阿里云ET虽然登上了《我是歌手》的舞台,并且还在双十一晚会上变了魔术,不过在外界看来,百度仍然是中国人工智能领域的领头羊。外媒FastCompany就在去年年底将百度排在最具创新的AI和机器学习企业榜单第三位,仅次于Google和IBM,也是唯一入选此榜单的中国企业。
但事实真的是如此吗?在阿里巴巴看来,人工智能技术在它们的未来战略中究竟处于何种位置?阿里的人工智能研究重点到底在哪边?
近日,极客公园带着这些问题拜访了阿里云ET的相关研究人员,我们将会带着大家一起来看看人工智能这个备受瞩目的技术领域在这家中国互联网巨头中的存在形态。
时机到了就回来年,已经在微软亚洲研究院担任常务副院长的王坚博士回到了杭州,加入了阿里巴巴集团,其时,阿里云还未成立。一年之后,阿里云正式成立,王坚成为其掌舵者。这时,面对新的局面,他也需要帮手,于是他找来了自己之前在微软的同事初敏。
加入阿里之前,初敏在微软亚洲研究院工作了近10年,创建并领导了其中的语音合成研究小组,她自己也是智能语音领域的专家。现在,她负责领导阿里云在智能语音方面的工作。
事实上,虽然「人工智能」这个技术领域目前主要被放在阿里云的体系下,但在几年以前,阿里内部已经在各个业务线上开始了初步的试探。「阿里(的人工智能部分)实际上到云上去的时间开始得挺晚的,我们从年下半年才开始搞的」,初敏说道,在此之前,她已经零零星星在阿里内部的翻译、输入法以及电商方面做了好几年的工作。
阿里云iDST技术总监、阿里云语音团队负责人初敏
与百度相比,阿里大规模进入人工智能领域的动作还是晚了不少。早在年年初,百度就成立了百度深度学习研究院(InstituteofDeepLearning,IDL),并在三个月之后在硅谷成立了硅谷人工智能实验室。
在当时,「人工智能」这个概念在业界方兴未艾,大公司中,除了百度,还很少有公司能这么早就进行系统性的布局。但就像初敏所说的:「在这个行业里,其实什么人工智能热不热跟我们没有关系,对技术人来讲是持续的、一直都在做的。外面的热是舆论上面的」,在背后,不管是阿里还是其他人,技术的积累和发展一直都在默默地发生。
很快,随着业界对人工智能领域在未来的不断看好,很多人的都意识到,就这项技术来说,如果你失去了这块领地,那你也将失去未来。所以,大约从14年开始,阿里陆陆续续找来了不少人工智能领域的世界级专家,开始系统性布局人工智能领域。
作为世界级的数据科学家,闵万里在年9月通过猎头的渠道回国加入了阿里,目前他是阿里云大数据孵化器团队的负责人。在谈到回国的原因时,他表示主要是因为「发现阿里这边数据非常大,而且数据种类也很丰富,比亚马逊+eBay+PayPal还多」。
有相似经历还有视觉团队的华先胜博士。自年从北京大学毕业之后,华先胜就一直在微软工作,一待就是14年。年年初,因为阿里的邀请,华先胜从西雅图回到了国内,加入了阿里巴巴。目前他则是阿里云视觉计算团队的负责人。
阿里云视觉计算团队的负责人华先胜
从13年开始,阿里巴巴陆续从世界各大顶尖团队挖来了多位世界级人工智能专家,美国密歇根州立大学终身教授金榕,麻省理工学院博士、普渡大学终身教授漆远都是在那段时间从美归来,加入了阿里。而就在本周,阿里再次抛出了一个重磅消息:亚马逊公司资深主任科学家任小枫正式加盟阿里巴巴,担任人工智能核心团队iDST的副院长和首席科学家。
这一切都显示,阿里已经成为了人工智能的人才争夺战中一支重要的力量。
一切从场景中长出来事实上,在13年之前,「人工智能」作为一个学术名词还停留在很多学术机构和大公司的实验室中,工业界还远未像今天这般重视这个技术领域,不过阿里在自己的专业领域——电商部门——已经初步有了一些智能化的雏形。
「你知道有的卖家的商品图片都是像牛皮癣一样,上来贴满了狗皮膏药,这种就不好了。怎么识别呢?其实就是人工智能的方法去识别,只是在三年前大家没有那么强调人工智能,实际上我们已经在做了。所以我们当时做了一些图片精美度的模型来看这个图片是否优美、是否违规,然后再基于这些判断这个商品是不是一个精品」,闵万里说道。
阿里云大数据孵化器团队的负责人闵万里
闵万里现在是阿里云大数据孵化器团队的负责人,回国之前,他先后在IBMWatson研究所和Google从事人工智能方面的研究工作。在他看来,阿里的人工智能是「从场景当中长出来的」,而这可能也是他们和其他公司的区别之一。
而在智能语音团队的初敏看来,阿里作为一家以电商立足的公司,「接地气」是阿里做人工智能最大的特点。在这里,「接地气」的意思就是「从下面的基础业务部门开始推动」。
一开始是业务部门感受到了这个趋势,然后小的业务部门就开始说我需要这个技术。可能最开始是从外面采购,后来才慢慢发现这个不对,这么重要的技术是应该我们自己要做的,然后就开始自己做。
他们二者的观点似乎是相同的,即阿里的人工智能都是从日常的应用场景而来,通过解决一个个技术难题慢慢走到了今天。
视觉团队的华先胜也赞同这个观点,作为图像搜索领域的世界级专家,他觉得图像搜索技术最合适的场景就是电商。
我能想象到最好的场景就是电商。我认为拍照购物这个场景是很有道理的,因为我经常看到一些东西,可能我不好描述。比如我很喜欢你这个背心,那我怎么描述它,这个不好描述,但是我拍张照片就好了。
为此,华先胜离开了微软来到了全世界最大的电商平台阿里巴巴,并且在一开始并没有加入阿里云团队,而是进入了电商团队的搜索事业部。在那里,他主要负责的项目就是淘宝App中的「拍立淘」功能。
手机淘宝中的拍立淘
「拍立淘」可以让用户通过拍照的方式实现「以图搜图」,以此来解决用户在不知道商品名称的情况下购买的问题。在此之前,淘宝其实已经有这个产品了,但是离用户的期望还差得很远。而华先胜通过一年多的工作让这项功能有了很大的提高,年双十一当日,拍立淘的使用量超过千万。
上云在搜索部门做了一年多之后,华先胜离开了那里,加入了阿里云。当时,云计算刚刚兴起不久,需求量逐步增加,「当时也是看到这个需求,我就过来了,其实后面的需求远远超过我所看到的。」
与他相似的还有闵万里,这位在刚刚进入阿里时也加入了电商部门做数据挖掘的科学家同样在不久之后转入了阿里云的体系。所有的一切都显示:阿里巴巴这家公司的人工智能技术被放到了阿里云的体系下去做。
事实上,作为国内最大的竞争对手,百度一直将人工智能作为自己未来最重要的核心战略,在年成立了北京和硅谷人工智能实验室之后,还早早从斯坦福大学挖来了世界级科学家吴恩达担任首席科学家。
相比之下,人工智能「仅仅」作为阿里云体系下的一个分支领域,似乎在阿里巴巴内部不够受到重视,真的是这样吗?
在初敏看来,随着PC被大量的移动设备代替以后,移动设备上面语音就是最好的入口,因为所有的输入方法里面只有语音是最简单的。但在这背后,其实所有的事都发生在云上。
而这「背后的事」主要有两方面:强大的计算能力以及广泛的应用场景。
首先,人工智能的基础就是算法和数据,如果没有足够强大的计算能力,计算机没有办法变聪明,而这恰恰是阿里云的长处。从年开始,阿里云在王坚博士的带领下开发了强大的飞天系统,这套系统目前有万个CPU的核,有60万块硬盘,相当于一个EB的存储能力。
第二点,作为属于未来的底层基本技术,人工智能的应用场景一定不仅限于电商领域,而这就需要阿里云发挥作用了。「因为阿里云服务的就是外面很多行业,所以从这点来讲,你看到行业的诉求和痛点的时候,你就有可能绽放出一个好的解决方案,把人工智能技术用起来,发现了成功案例就去宣传。」
目前,阿里云在自己的平台上开放了多个相关的API,比如人脸识别、智能语音交互等等。外部的创业公司可以通过使用阿里云的服务免去自己开发的相关步骤,而他们在使用过程中产生的数据经过回流还可以让阿里云ET变得更聪明,「这其实是个双赢的事情。」
将人工智能与「云」结合起来的战略还体现在云OS操作系统上。目前,据初敏透露,阿里云智能语音团队很大的一块工作就是跟云OS进行深度合作,因为「云OS的操作系统是支持多端的,这里面云能力也是需要多端的,而且应该是多端打通的」。
不过,在采访中,阿里云的相关工作人员也表示「人工智能」在阿里内部的地位未来还会再提高。虽然截至本文发表当天还没有确切的相关消息,但就在今年年初的阿里巴巴集团首届技术大会上,马云宣布将建立阿里巴巴的『NASA』,「面向机器学习、芯片、IoT、操作系统、生物识别这些核心技术组建崭新的团队,建立新的机制和方法。」
但无论未来人工智能被阿里提到哪一个层级,阿里云都会是其中重要的一环。
要做平台「苹果会说自己在人工智能行业是『secondtonone』,你们会怎么评价自己?」
「其实从技术上来讲,各家都有特色,或者说侧重点不一样。但是从人工智能在业务领域、垂直行业的创新上来说,我觉得阿里巴巴现在应该走在全球的最前面。」阿里云大数据孵化器团队的负责人闵万里说道。
因为自己带领的既是一个技术团队,同时还是一个业务落地的团队,所以闵万里需要承担商业方面的KPI指标,但这也让他和阿里云人工智能的落地情况有了更深的了解。他同时认为,阿里和其他公司在人工智能方面的最大差别就是「对技术和业务场景的深刻理解和抽象提炼」,但这并不表示阿里需要把所有的场景都自己做掉。
杭州城市大脑项目正式发布的现场
我们要在某些垂直行业当中找到1到2个创新的案例,我们要证明这些能力加上正确的方法,能够在这个行业产生价值,后面才会有更多的公司愿意跟着我们一起在这个行业当中深挖,把另外的一些痛点给解了,这样我们就把这个生态给做起来了。
承接各个场景,这种对业务领域的广泛布局成为了阿里的优势,也自然而然变成了他们未来的长远目标。
「建立云上视觉计算的生态」——这是华先胜心目中的长远目标。在他看来,广义的AI也可以平台化、生态化,这样「大家都可以在AI的平台上去做研发、部署和生产」。
阿里云
转载请注明:http://www.0431gb208.com/sjsbszl/765.html