ICode9

精准搜索请尝试: 精确搜索
  • 神经网络优化-动量梯度下降法(牛顿法)2022-07-31 14:33:51

    背景 对于标准梯度下降过程,wt的更新是wt=wt-1-△w,而wt=wt-1-△w仅仅是对于当前点wt的△w,没有对于历史数据的考量(通俗点说叫经验教训) 结果就是下降(优化)过程前进方向速度缓慢,同时产生振荡(如图红线) 据此引入冲量v,令vt=vt-1-△w,由迭代思想知冲量v代表着从初始到当前△w的累积(即过程中

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有