标签:输出 Ux2 RNN Ux1 梯度 Ws0 神经网络 状态值 ot
St为t时刻的隐含层状态值;
Ot为t时刻的输出值;
①是隐含层计算公式,U是输入x的权重矩阵,St-1是t-1时刻的状态值,W是St-1作为输入的权重矩阵,ΦΦ是激活函数;
②是输出层计算公司,V是输出层的权重矩阵,f是激活函数。
损失函数(loss function)采用交叉熵Lt=−ot¯¯¯¯logotLt=−ot¯logot(Ot是t时刻预测输出,ot¯¯¯¯ot¯是t时刻正确的输出)
那么对于一次训练任务中,损失函数L=∑Ti=1−ot¯¯¯¯logotL=∑i=1T−ot¯logot, T是序列总长度。
假设初始状态St为0,t=3 有三段时间序列时,由 ① 带入②可得到
t1、t2、t3 各个状态和输出为:
t=1:
状态值:s1=Φ(Ux1+Ws0)s1=Φ(Ux1+Ws0)
输出:o1=f(VΦ(Ux1+Ws0))o1=f(VΦ(Ux1+Ws0))
t=2:
状态值:s2=Φ(Ux2+Ws1)s2=Φ(Ux2+Ws1)
输出:o2=f(VΦ(Ux2+Ws1))=f(VΦ(Ux2+WΦ(Ux1+Ws0)))o2=f(VΦ(Ux2+Ws1))=f(VΦ(Ux2+WΦ(Ux1+Ws0)))
t=3:
状态值:s3=Φ(Ux3+Ws2)s3=Φ(Ux3+Ws2)
输出:o3=f(VΦ(Ux3+Ws2))=⋯=f(VΦ(Ux3+WΦ(Ux2+WΦ(Ux1+Ws0))))
标签:输出,Ux2,RNN,Ux1,梯度,Ws0,神经网络,状态值,ot 来源: https://www.cnblogs.com/fghh/p/13424199.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。