标签:GRU 7D% 推导 5E% 3E% 7B% 反向 plus 5Cpartial%
1、正向传播
计算图(红色部分不属于时间步t):
公式:
2、反向传播
GRU反向传播的计算图(红色部分不属于时间步t):
根据计算图,从上往下推导反向传播的公式。
对于输出激活函数是softmax,损失函数是交叉熵的情况,常用的公式是:
(1)
我在RNN反向传播的推导中证明了这个公式,这里就不证明了。
根据
我们可以进而得到:
(2)
(3)
(4)
只需要利用,以上公式和RNN的情况是一模一样的,也不多解释了。
正如计算图所显示的那样,的导数总共和5项相关,即:
(5.a)
考虑正向传播的以下公式:
得到:
(其中)
(其中)
(其中)
标签:GRU,7D%,推导,5E%,3E%,7B%,反向,plus,5Cpartial% 来源: https://blog.csdn.net/weixin_52100611/article/details/119333215
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。