毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

技术科普用高中数学理解AI深度学习的

来源:语言识别 时间:2023/3/5
治疗白癜风的最新方法 http://m.39.net/pf/a_4687762.html

机器听不懂我们人类语言,我们得用数学语言向它描述问题,这就叫“建模”。

Google研发了十年自动驾驶后,终于在本月上线了自动驾驶出租车服务。感谢“深度学习”技术,人工智能近年来在自动驾驶、疾病诊断、机器翻译等领域取得史无前例的突破,甚至还搞出了些让人惊艳的“艺术创作”:

Prisma把你的照片变成艺术作品

AI生成的奥巴马讲话视频,看得出谁是本尊吗?

开源软件style2paints能自动给漫画人物上色

如果不了解其中的原理,你可能会觉得这是黑魔法。

但就像爱情,“深度学习”虽然深奥,本质却很简单。无论是图像识别还是语义分析,机器的“学习”能力都来源于同一个算法—梯度下降法(GradientDescent)。要理解这个算法,你所需要的仅仅是高中数学。在读完这篇文章后,你看待AI的眼光会被永远改变。

一个例子

我们从一个具体的例子出发:如何训练机器学会预测书价。在现实中,书的价格由很多因素决定。但为了让问题简单点,我们只考虑书的页数这一个因素。

在机器学习领域,这样的问题被称为“监督学习(SupervisedLearning)”。意思是,如果我们想让机器学会一件事(比如预测书的价格),那就给它看很多例子,让它学会举一反三(预测一本从未见过的书多少钱)。其实跟人类的学习方法差不多,对吧?

现在假设我们收集了本书的价格,作为给机器学习的例子。大致情况如下:

接下来我们要做两件事:

告诉机器该学习什么;等机器学习。

告诉机器该学什么

为了让机器听懂问题,我们不能说普通话,得用数学语言向它描述问题,这就是所谓的“建模”。为了让接下来的分析更直观,我们把收集回来的例子画在数轴上:

我们希望机器通过这些样本,学会举一反三,当看到一本从未见过的书时,也能预测价格。比如说,预测一本页的书多少钱:

页的书多少钱?

观察图表,我们能看出页数和书价大致上是线性关系,也就是说,我们可以画一根贯穿样本的直线,作为预测模型。

如果我们把页数看作X轴,书价看作Y轴,这根直线就可以表示为:

w决定直线的倾斜程度,b决定这根直线和Y轴相交的位置。问题是,看起来有很多条线都是不错的选择,该选哪条?换句话说w和b该等于多少呢?

每根直线都是一个候选的模型,该选哪个?

显然,我们希望找到一根直线,它所预测的书价,跟已知样本的误差最小。换句话说,我们希望下图中的所有红线,平均来说越短越好。

红线的长度,就是模型(蓝色虚线)预测的书价,和样本书价(蓝点)之间的误差

红线的长度等于预测书价和样本书价的差。以第一个样本为例,55页的书,价格69元,所以第一根红线的长度等于:

因为绝对值不便于后面的数学推导,我们加个平方,一样能衡量红线的长度。

因为我们的预测模型是:

所以这个样本是一本55页,69元的书。

算式开始变得越来越长了,但记住,这都是初中数学而已!前面提到,我们希望所有红线平均来说越短越好,假设我们有个样本,用数学来表达就是:

至此,我们把“预测书价”这个问题翻译成数学语言:“找出w和b的值,使得以上算式的值最小。”坚持住,第一步马上结束了!

我们现在有2个未知数:w和b。为了让问题简单一点,我们假设b的最佳答案是0好了,现在,我们只需要

转载请注明:http://www.0431gb208.com/sjszlfa/3594.html