ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

激活函数简介

2022-02-24 21:59:42  阅读:281  来源: 互联网

标签:输出 函数 简介 ReLU 梯度 激活 神经元


1、什么是激活函数?

单一神经元模型展示:

这里写图片描述

神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值,并将输入值传入下一层,输入层神经元节点会将属性值直接传递给下一层(隐层或输出层)。在多层神经网络中,上节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数(又叫激励函数)

2、为什么需要激活函数?

神经网络中,如果不加入激活函数,那么每一层的输入输出都是函数均是线性的,网络的逼近能力有限,于是就引入非线性函数作为激活函数,使网络的表达能力更强。

3、有哪些激活函数?

第一个:sigmoid函数

公式:

图像:

这里写图片描述

 

特点:

变换输出区间[0,1],特别的如果出现很大的负数,则输出为0;如果输出很大的正数,则输出为1。

缺点:

1】神经网络在反向传播时,会出现梯度爆炸和梯度消失,梯度爆炸概率小,梯度消失概率大。

 如果我们初始化神经网络的权值为 [ 0 , 1 ] [0,1][0,1] 之间的随机值,由反向传播算法的数学推导可知,梯度从后向前传播时,每传递一层梯度值都会减小为原来的0.25倍,如果神经网络隐层特别多,那么梯度在穿过多层后将变得非常小接近于0,即出现梯度消失现象;当网络权值初始化为 ( 1 , + ∞ ) (1,+∞)(1,+∞) 区间内的值,则会出现梯度爆炸情况。

2】sigmoid的输出层不是0均值(zero-centered),会导致后一层的神经元将上一层输出的非0均值的信号作为输入。 产生的一个结果就是:那么对w求局部梯度则都为正,这样在反向传播的过程中w要么都往正方向更新,要么都往负方向更新,导致有一种捆绑的效果,使得收敛缓慢。 当然了,如果按batch去训练,那么那个batch可能得到不同的信号,所以这个问题还是可以缓解一下的。因此,非0均值这个问题虽然会产生一些不好的影响,不过跟上面提到的梯度消失问题相比还是要好很多的。

3】含有幂运算,耗时。

 第二个:tanh函数

公式:

函数 图像及导数

tanh(x)及其导数的几何图像

 

tanh全称叫做Hyperbolic Tangent。

tanh的出现解决了sigmoid的非0均值,但是梯度消失和梯度爆炸问题还是没有很好的解决。

第三个:Relu函数

公式:

 函数图像和导数图像:

这里写图片描述

 优点:

1) 解决了gradient vanishing问题 (在正区间)
2)计算速度非常快,只需要判断输入是否大于0
3)收敛速度远快于sigmoid和tanh

注意问题:

1)ReLU的输出不是zero-centered
2)Dead ReLU Problem,指的是某些神经元可能永远不会被激活,导致相应的参数永远不能被更新。有两个主要原因可能导致这种情况产生: (1) 非常不幸的参数初始化,这种情况比较少见 (2) learning rate太高导致在训练过程中参数更新太大,不幸使网络进入这种状态。解决方法是可以采用Xavier初始化方法,以及避免将learning rate设置太大或使用adagrad等自动调节learning rate的算法。

尽管存在这两个问题,ReLU目前仍是最常用的activation function,在搭建人工神经网络的时候推荐优先尝试!

第四个:Leaky Relu函数

公式:

 函数图像和导数图像:

这里写图片描述

 

解决了Dead Relu Promble。

理论上来讲,Leaky ReLU有ReLU的所有优点,外加不会有Dead ReLU问题,但是在实际操作当中,并没有完全证明Leaky ReLU总是好于ReLU。

以上借鉴:

(19条消息) 常用激活函数(激励函数)理解与总结_tyhj_sf的博客空间-CSDN博客_激活函数

感谢大佬分享

标签:输出,函数,简介,ReLU,梯度,激活,神经元
来源: https://blog.csdn.net/weixin_46319994/article/details/123121234

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有