全文共字,预计学习时长5分钟
事实上,未来初创企业的商业计划非常容易猜到:采用“X+AI”模式,X可以是任何一个行业或者场景。即在适合的领域加入在线智能,让其不断发展壮大。KevinKelly《必然》
过去几年,人工智能一直是最热门话题之一。优秀人才纷纷参与人工智能研究,大型企业会拨出巨额资金支持该领域发展,而人工智能初创企业每年可以获得数十亿美元的投资。
如果你正在考虑改进业务流程,或正在寻求新的想法,那么很可能会想到人工智能。为了更高效地运用人工智能,需要深入了解其组成部分。
人工智能
人工智能到底是什么?Keras之父、Google人工智能研究员FrancoisChollet在其书《Python深度学习》(DeepLearningwithPython)中给出了一个简短的定义:“人类通过努力实现智力活动的自动化。因此,人工智能是一个涵盖机器学习和深度学习的通用领域,也包括许多不涉及任何学习的方法。”
例如,如今聊天机器人的前身Eliza是由麻省理工学院人工智能实验室创造的。这个程序可以和人类进行长时间对话,但不能在对话中学习新单词或纠正行为。Eliza的行为是通过一种特殊的编程语言明确制定的。
现代意义上的人工智能始于20世纪50年代,艾伦图灵(AlanTuring)和达特茅斯研讨会(Dartmouthworkshop)将这一领域的首批爱好者聚集在一起,由此形成了人工智能科学的基本原理。此外,在成为当今世界科学关键领域的过程中,人工智能产业经历了多次兴趣激增和衰退(也就是所谓的“人工智能的冬天”)。
值得一提的是强人工智能和弱人工智能的假设。强人工智能可以思考,并能够像一个独立的人一样拥有意识。弱人工智能则没有这些能力,只能执行一定范围内的任务(下棋、识别图像中的猫或画一张售价43.25万美元的画)。目前已有的都属于弱人工智能,还不必过于担心。
如今,离开人工智能,人类几乎寸步难行。无论是开车、自拍、上网购物还是安排度假,几乎随处都能发现人工智能的存在。这种存在极易被忽略,却非常重要。
机器学习
不管是人工智能还是非人工智能,其关键特征是学习的能力。对人工智能而言,有一系列机器学习模型负责培养这种能力。其本质与经典算法不同。经典算法是一组清晰的指令,能将输入的数据转换成结果,而机器学习基于数据样本和相应结果,在数据中发现模式并生成一种算法,能够将任意数据转换成所需的结果。
机器学习主要分为三类:
监督学习——系统以已知结果的数据样本为基础,对每一个样本进行训练。机器学习有两种任务最为热门:回归(regression)和分类(classification)。回归针对连续型变量,比如房价或制造业排放水平。分类则是对某一类别的预测。例如,一封邮件是否属于垃圾邮件,某一本书属于侦探小说还是百科全书等等。
无监督学习——系统本身发现数据内部的关系和模式。在此情况下,每一个样本的结果都是未知的。
强化学习——一种奖励系统正确行为,惩罚系统错误行为的方法。因此,系统学会了开发某种算法,可以得到最高的奖励和最低的惩罚。
一个理想的机器学习模型可以分析任何数据,找到所有的模式,并创建算法以实现所有期望得到的结果。但这一理想的模型尚未建立。华盛顿大学教授PedroDomingos在其著作《主算法》(TheMasterAlgorithm)中就有讲到其创建过程。
如今的机器学习模型专注于特定的任务,都有各自的优缺点。这些模型包括:
线性回归(Linearregression)是一种经典的统计模型。顾名思义,它是为回归任务设计的,即可以用来预测连续值。例如,柠檬水的销量高低取决于天气的好坏。
逻辑回归(Logisticregression)用于分类任务,预测给定样本属于特定类别的概率。
决策树(DecisionTree)是一种常用的分类方法。在这种方法中,给定对象的类别根据一系列问题的回答来确定。每一问题的答案通常为“是”或“否”。
K最近邻(k-NearestNeighbor,KNN)分类算法是一种简单、快速的分类方法。在这种方法中,如果一个样本在特征空间中的k(个k可以为任意值)最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
朴素贝叶斯(NaiveBayes)是一种流行的分类方法。它利用概率论和贝叶斯定理来确定某一事件(某一邮件为垃圾邮件)在给定条件下的可能性(邮件中20次出现“免息贷款”等词汇)。
支持向量机(SupportVectormachines)简称SVM,是一种监督机器学习算法,常用于分类任务。即使每个对象之间有很多相互关联的特性,它也能够有效分离不同类别的对象。
集成学习(Ensembles)结合了许多机器学习模型,并根据“投票法”,即少数服从多数,或将结果平均化,从而确定对象类别。
神经网络(Neuralnetworks)是以人脑的原理为基础的。神经网络由许多相互联系的神经元组成。神经元可以表示为具有多个输入和一个输出的函数。每个神经元从输入中获取参数(每个输入的不同权重决定了其重要程度),对其执行特定功能,并将结果输出。一个神经元的输出可以是另一个神经元的输入。因此,多层神经网络得以形成。这是深度学习的主题。之后将对这个问题进行详细讨论。
神经元结构图:
含两层隐藏层的人工神经网络:
通过研究给定样本,神经网络调整神经元之间的权重,使对预期结果影响最大的神经元获得最大的权重。例如,如果一个动物是条纹的,毛茸茸的,会喵喵叫,那么它很可能是一只猫。同时,我们将最大权值赋给“会喵喵叫”这一参数。所以,如果这只动物没有条纹,也不是毛茸茸的,但会喵喵叫——它仍然很可能是一只猫。
深度学习
深度学习涉及到深度神经网络。关于深度的观点各有不同。一些专家认为,有两个或以上隐藏层的神经网络,即可被认为是深度的;而另一些专家则认为,只有拥有多个隐藏层的神经网络,才可以被认为是深度的。
现在已经有一些不同类型的神经网络得到了积极的应用。其中最受欢迎的有:
长短期记忆网络(LSTM)用于文本分类和生成、语音识别、创作歌曲和时间序列预测。
卷积神经网络(CNN)用于图像识别、视频分析和自然语言处理任务。
结论
那么,人工智能、机器学习和深度学习之间有什么区别呢?相信通过阅读这篇文章,你已经有了答案。人工智能是智能任务自动化的一个广泛领域(如阅读、下围棋、图像识别和建造自动驾驶汽车);机器学习是一套人工智能方法,负责培养人工智能的学习能力;深度学习则属于研究多层神经网络的机器学习方法。
留言点赞
转载请注明:http://www.0431gb208.com/sjszjzl/4394.html