ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

李宏毅 RNN 视频课程学习

2021-03-06 11:29:28  阅读:189  来源: 互联网

标签:RNN 李宏毅 模型 课程 信号 LSTM 门控 输入


李宏毅 RNN 视频课程学习

  1. 图里面,每个相同的权重使用同样的颜色表示。
    在这里插入图片描述

  2. 两种不同的RNN网络模型
    在这里插入图片描述

  3. RNN 网络模型可以同时训练一个正向的和一个逆向的网络模型,这样在产生一个output的时候,
    在这里插入图片描述

  4. 一个LSTM的CELL有4个输入信号:input vector, 输入门 输出门,遗忘门的门控信号。
    在这里插入图片描述

  5. c是之前的memory cell 里面存放的历史记忆(从上一个cell传递过来的隐藏状态吧),根据当前时刻的输入信号,以及当前时刻的三个门控信号,得到的下一个时刻的隐藏状态c’以及当前时刻的输出a为以下图中的表达式,其中, f为激活函数,一般选用sigmoid激活函数,因为这个函数的输出在0-1之间,刚好可以根据值的大小,按照比例调节门控信号,控制通过门控的信号。

在这里插入图片描述
6. 手动计算LSTM 数据流图的例子,最上面的蓝色的一行代表的是memory。
在这里插入图片描述
7. 实际的运算过程,上面 6 里面的三种情况,在下图中,根据每个边上的权重不同,刚好可以实现上述的功能,使用的激活函数为sigmoid。

下图中的计算结果需要假设 h 和 g 的值均是线性的,并且假设初始存在memory里面的值为 0 。
门控信号的值为1的时候代表门被打开,信号可以通过,为0的时候代表门关闭,信号无法通过。
在这里插入图片描述
8. 下面两幅图对比全连接神经网络与LSTM 神经网络的区别,在LSTM模型中,输入 x1, x2 组合起来,根据权重进行加权后,分别用作输入信号,输入门门控信号,输出门门控信号,遗忘门门控信号。
由此可以发现,在神经元数量一样的情况下,LSTM 模型的数据量是全连接神经网络模型的数据量的4倍
通过对比可以发现,LSTM 相比全连接神经网络,是将原来的一个神经元替换为一个LSTM 神经元。

在这里插入图片描述

在这里插入图片描述
9. 讲到这里的话,还没有体现循环网络的循环的特性以及记忆的功能,下面的这两个图里面讲述了循环的所在,其中的 zf,zi,z,zo依次是遗忘门的门控信号的权重矩阵,输入门门控信号的权重矩阵,输入信号的权重矩阵(线性层之类的),输出门的门控信号的权重矩阵。

在这里插入图片描述
在这里插入图片描述

  1. 通常用作下一个时刻点的输入信号不只是下一个时刻的输入,还有上一个时刻的memory(隐藏层)以及输出层

在这里插入图片描述

  1. 此外,通常LSTM 不只只有一层的,可能有好多层

在这里插入图片描述

  1. GRU 相比LSTM 少了一个门,参数量少了 1/3,但是性能接近,而且不容易过拟合。

  2. 完成前向传播以后,需要进行反向传播,来更新网络的权重参数以达到降低loss的目的。

在这里插入图片描述

  1. 在RNN的训练过程中,使用relu作为激活函数,通常效果会比 sigmoid激活函数的效果要差一些。

  2. RNN的根本问题在于,同样的一组参数,随着时间的传递,会被反复用到,LSTM可以改善梯度消失的状况,但是不能很好的改善梯度爆炸。对于RNN网络,在每一个时刻点,memory里面的数据都会被完全覆盖掉,但是在LSTM里面,是将上一个时刻的memory里面的值乘以一个值 再和当前时刻的输入加起来 放到cell里面去,所以LSTM的memory和input是相加的。

  3. 在RNN的训练过程中,可以将学习率设置的尽量小一点。

  4. 在训练的过程中,最好给遗忘门设置一个比较大的bias,以保证遗忘门大部分时间都是开启的,防止太多的数据被遗忘掉。

  5. 对比深度学习算法与经典机器学习算法,两者的特点如下图,这两种方法可以组合起来使用,分别发挥两种模型的优势。

在这里插入图片描述

  1. 输入的特征先通过 RNN 网络模型,RNN 网络模型的输出再作为 HMM,CRF,Sturctured Perceptron/SVM的input。
    用RNN,LSTM 的input来定义 HMM,CRF,Sturctured Perceptron/SVM 等算法的evaluate function。
    在这里插入图片描述

模型混合使用的方式。
在这里插入图片描述
在这里插入图片描述

标签:RNN,李宏毅,模型,课程,信号,LSTM,门控,输入
来源: https://blog.csdn.net/weixin_37532614/article/details/114370592

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有