年5月27日,中国棋手柯洁(左)在与“阿尔法围棋”的第三场对局中思考自年人工智能走出实验室进入到产业化阶段以来,人工智能界在算法理论、基础与平台、应用技术、终端产品、行业应用以及未来探索领域涌现出了诸多领军团队,引领着人工智能的发展方向。
文/徐贵宝
自年人工智能走出实验室进入到产业化阶段以来,在产业链各环节的不懈推动下,人工智能开始以前所未有的速度渗透进各个行业,并成为深刻改变人类生产生活方式的革命性力量。
在此期间,人工智能界在算法理论、基础与平台、应用技术、终端产品、行业应用以及未来探索领域涌现出了诸多领军团队,引领着人工智能的发展方向。
算法理论
当前应用最广泛的算法当属于深度学习算法了。美国神经网络之父杰弗里·欣顿(GeoffreyHinton)在年提出的深度学习算法,通过构建多隐层模型和海量训练数据来学习更有用的特征,最终提升了分析和预测的准确性。
也正是深度学习算法与云计算、大数据的共同作用,才使得人工智能华丽蜕变,开启了产业化的大门,成为了产业发展的新引擎。而为深度学习的产生与发展做出卓越贡献的深度学习三驾马车——欣顿、加拿大蒙特利尔大学教授约舒亚·本希奥(YoshuaBengio)、纽约大学教授扬·莱坎(YannLecun)也深受企业界青睐,目前他们分别受雇于美国的顶级公司谷歌、微软和脸书,并成为年的图灵奖获得者。
为进一步提高深度学习的效率和准确率,学术界一直在探索对深度学习算法的深化和改善研究。这一方面取得最大成绩的当属谷歌旗下的Deepmind公司,其AlphaGo由于采用深度强化学习算法而一路战胜李世石、柯洁等一系列人类围棋冠军而闻名天下,后来推出的新版本AlphaZero甚至又战胜了AlphaGo。
在信息非对称的博弈中,卡耐基梅隆大学开发的人工智能Libratus在与4名人类顶尖得州扑克选手之间的“人机大战”中也取得了压倒性胜利。此外,比较知名的算法还有谷歌大脑研究科学家IanGoodfellow提出的对抗式生成网络、南京大学周志华教授提出的深度森林、新加坡南洋理工大学黄广斌教授提出的超限学习机等。
但是,随着深度学习应用逐步深入,其不可解释性与黑箱问题等也在近两年逐步暴露出来。因此,一些传统的机器学习算法重新受到重视,如年美国计算机科学家犹大·伯尔(JudeaPearl)提出的贝叶斯网络、年谷歌提出的知识图谱等。另外,还有一些新型算法,包括欣顿提出的胶囊网络、谷歌大脑与Deepmind提出的图网络等。
基础与平台领域
在通用芯片设计方面,美国英伟达(NVIDIA)的Tesla等系列GPU、谷歌的TPU以及英特尔(Intel)的NNP等产品都属于国际领先的云端芯片;三星、苹果、高通等终端厂商也都有相应的终端芯片产品;中国的寒武纪在深度学习芯片设计方面也已经达到国际先进水平。
在专用芯片设计方面,特斯拉年4月发布了自主研发的自动驾驶专用芯片以及CPU、GPU、ISP等一系列芯片,其完全自动驾驶计算机可以达到TOPS的算力,但功耗仅为72W,并已搭载在目前新生产的特斯拉旗下车型中。总部位于北京的地平线机器人年底发布了面向智能驾驶的Journey1.0和面向摄像头的Sunrize1.0处理器。
在半导体加工设备方面,超高精密仪器、数控机床、光刻机等基本上被美国、日本、荷兰等垄断,包括美国的应用材料公司、日本的日立、荷兰的阿斯麦(ASML)等。
在芯片生产方面,目前来自中国台湾的台积电处于世界领先水平,它将于年开始5nm制程的量产,而且3nm制程的环境影响评价已获通过,2nm制程计划已经制订。
深度学习模型需要基于大量的数据进行训练才能获得较好的参数,因此国际上一些大型科研机构和企业非常重视数据集的建设。数据集建设的先驱当属于美国斯坦福大学的华裔科学家李飞飞,她于年成功创建ImageNet数据集,并通过举办比赛等方式极大地促进了图像识别算法的进步,使其分类精度达到了95%以上。
目前,比较知名的数据集包括美国国家标准研究院的Mugshot、谷歌的SVHN、微软的MSCOCO等图像基础数据集、斯坦福大学的SQuAD、卡耐基梅隆大学的Q/ADataset、Salesforce的WikiText等自然语言数据集以及HUB5English、CHiME、TED-LIUM等语音数据集。另外,澳大利亚的数据集Kaggle横跨多个领域,具有较强的综合性,其影响力也正在逐年增强。
由于深度学习对算力有较高的需求,因此相继出现了一些专门的计算框架和平台,著名的框架包括谷歌的TensorFlow、加州大学伯克利分校的Caffe、微软的CNTK、脸书的Torch、亚马逊的MXNet等。其中,谷歌的TensorFlow能够支持异构设备的分布式计算,其平台API能力已经覆盖了CNN、RNN、LSTM等当前最流行的深度神经网络模型。
中国的百度公司也于年宣布了开源PaddlePaddle深度学习平台,并于年4月发布了10余项新特性及服务,覆盖深度学习开发、训练、预测环节。
开发语言和工具涉及脚本语言、开发平台以及芯片设计工具等。
由荷兰的吉多·范罗苏姆(GuidovanRossum)于年代初开发出来的脚本语言Python语言已经成为广受欢迎、用途广泛的AI开发语言。微软在其Build开发者会议上宣布在VisualStudio中默认包含IntelliCode。谷歌于年发布了AutoML,大大降低了人工智能开发者的门槛,目前已经能够支持图像、翻译、视频和自然语言处理等多个领域。
谷歌还推出一个名为AIPlatform的人工智能训练平台,为人工智能研究人员的团队测试、培训以及部署模型提供了一个共享型端到端环境。
在智能化芯片设计工具方面,由于高集成度、高速度、高性能、高功效等要求,电子设计自动化(EDA)已经成为必不可少的工具。自年Calma公司发布GDS-II以来,EDA市场经过激烈的竞争,目前已经形成了Cadence、Synopsys、MentorGraphics三足鼎立的局面。
应用技术领域
语音识别与自然语言处理领域的先驱当属于IBM,其ViaVoice早在年就已经引起了广泛
转载请注明:http://www.0431gb208.com/sjszjzl/4549.html