ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

12、优化算法

2022-06-27 16:34:25  阅读:166  来源: 互联网

标签:12 梯度 下降 算法 方向 优化 梯度方向 向量


在机器学习算法中,对于很多监督学习模型,需要对原始的模型构建损失函数,之后通过优化算法对损失函数进行优化,寻找到最优的参数。求解机器学习参数的优化算法中,使用较多的是基于梯度下降的优化算法(Gradient Descent, GD),梯度下降法的含义是通过当前点的梯度方向寻找到新的迭代点。
基本思想可以这样理解:我们从山上的某一点出发,找一个最陡的坡走一步(也就是找梯度方向),到达一个点之后,再找最陡的坡,再走一步,直到我们不断的这么走,走到最“低”点(最小花费函数收敛点)。这里的下山最陡的方向就是梯度的负方向

通俗来说,梯度就是函数在当前位置的导数。

[公式]

上式中, [公式] 是自变量, [公式] 是关于 [公式] 的函数, [公式] 表示梯度。

1、梯度下降法

[公式]

其中, [公式] 是自变量参数,即下山位置坐标, [公式] 是学习因子,即下山每次前进的一小步(步长), [公式] 是更新后的 [公式] ,即下山移动一小步之后的位置。

梯度下降算法的公式非常简单!但是”沿着梯度的反方向(坡度最陡)“是我们日常经验得到的,其本质的原因到底是什么呢?为什么局部下降最快的方向就是梯度的负方向呢?接下来我将以通俗的语言来详细解释梯度下降算法公式的数学推导过程。

2、一阶泰勒展开

[公式]

3、梯度下降数学原理

先写出一阶泰勒展开式的表达式:

 

[公式]

 

其中, [公式] 是微小矢量,它的大小就是我们之前讲的步进长度 [公式] ,类比于下山过程中每次前进的一小步, [公式] 为标量,而 [公式] 的单位向量用 [公式] 表示。则 [公式] 可表示为:

 

[公式]

 

特别需要注意的是, [公式] 不能太大,因为太大的话,线性近似就不够准确,一阶泰勒近似也不成立了。替换之后, [公式] 的表达式为:

 

[公式]

 

重点来了,局部下降的目的是希望每次 [公式] 更新,都能让函数值 [公式] 变小。也就是说,上式中,我们希望 [公式] 。则有:

 

[公式]

 

因为 [公式] 为标量,且一般设定为正值,所以可以忽略,不等式变成了:

 

[公式]

 

上面这个不等式非常重要! [公式] 和 [公式] 都是向量, [公式] 是当前位置的梯度方向, [公式] 表示下一步前进的单位向量,是需要我们求解的,有了它,就能根据 [公式] 确定 [公式] 值了。

想要两个向量的乘积小于零,我们先来看一下两个向量乘积包含哪几种情况:

[公式] 和 [公式] 均为向量, [公式] 为两个向量之间的夹角。 [公式] 和 [公式] 的乘积为:

 

[公式]

 

[公式] 和 [公式] 均为标量,在 [公式] 和 [公式] 确定的情况下,只要 [公式] ,即 [公式] 和 [公式] 完全反向,就能让 [公式] 和 [公式] 的向量乘积最小(负最大值)。

顾名思义,当 [公式] 与 [公式] 互为反向,即 [公式] 为当前梯度方向的负方向的时候,能让 [公式] 最大程度地小,也就保证了 [公式] 的方向是局部下降最快的方向。

知道 [公式] 是 [公式] 的反方向后,可直接得到:

 

[公式]

 

之所以要除以 [公式] 的模 [公式] ,是因为 [公式] 是单位向量。

求出最优解 [公式] 之后,带入到 [公式] 中,得:

 

[公式]

 

一般地,因为 [公式] 是标量,可以并入到步进因子 [公式] 中,即简化为:

 

[公式]

 

这样,我们就推导得到了梯度下降算法中 [公式] 的更新表达式。

 

 

参考:

https://zhuanlan.zhihu.com/p/36503663

 

标签:12,梯度,下降,算法,方向,优化,梯度方向,向量
来源: https://www.cnblogs.com/ljygoodgoodstudydaydayup/p/16416519.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有