当前位置: 首页 > news >正文

兼职做一篇微信的网站东莞营业厅

兼职做一篇微信的网站,东莞营业厅,宁夏成城建设集团网站,深圳网站优化费用1.RMSprop算法 1.1.算法流程 除了动量梯度下降法,RMSprop算法也可以加快梯度下降,这个算法的算法流程如下:深度学习基础—动量梯度下降法http://t.csdnimg.cn/zeGRo 1.2.算法原理 和动量梯度下降不同的是,对dW和db的变成了平方项…

1.RMSprop算法

1.1.算法流程

        除了动量梯度下降法,RMSprop算法也可以加快梯度下降,这个算法的算法流程如下:深度学习基础—动量梯度下降法icon-default.png?t=N7T8http://t.csdnimg.cn/zeGRo

1.2.算法原理

        和动量梯度下降不同的是,对dW和db的变成了平方项,同时权重更新变为了(dW/sqrt(SdW))和(db/sqrt(Sdb)),这样做的原因如下:

        如上图,损失函数是关于参数W和b的函数,因此简化为x轴表示W的优化方向,y轴表示b的优化方向。同动量梯度下降,我们希望减少y轴方向的摆动,加快x轴方向的优化,因此有SdW和Sdb。观察微分的方向,可以发现:摆动幅度过大,因此损失函数的斜率在b方向上的分量更多,也就是db更大,相反dW更小。于是SdW更小,Sdb更大。为了让W的变化幅度更大(加速x轴),b的变化幅度更小(减小y轴摆动),因此为W更新公式的dW除以一个较小的数,即sqrt(SdW),b更新公式的db除以更大的数,即sqrt(Sdb),达到削减大梯度的方向的梯度,增加小梯度方向的梯度,从而减小摆动,进而可以选择较大的学习率,加快模型的收敛。

        注意:为了防止分母为0的风险,可以给分母+ℇ,即sqrt(SdW)+ℇ,ℇ通常取10^(-8),同理sqrt(Sdb)也是。

2.Adam 优化算法

        Adam 优化算法是RMSprop算法和动量梯度下降法的结合版,该算法性能优秀,已被证明能适用多种不同结构的神经网络。该算法的算法流程如下:

        本算法有很多超参数:学习率a,动量梯度下降法参数b1,RMSprop算法参数b2,ℇ。对于这些参数,默认b1=0.9,b2=0.999,ℇ=10^(-8)。一般不需要变动,但是学习率需要多次调试找到合适值。

http://www.yayakq.cn/news/806703/

相关文章:

  • 珠海网站建设乐云seo在线制作网页版word在线编辑
  • 外贸网站营销方案太原网站建设注意
  • 温州网站建设方案文档制作e4a做网站软件
  • 先做网站先备案wordpress仿站主题
  • photoshop网站模板设计教程wordpress中文版和英文版区别
  • 国美电器如何进行网站的建设与维护wordpress 昵称留链接
  • WordPress怎么建小站如何分步骤开展seo工作
  • 乌托邦网站建设网站安全建设目的
  • 做网商哪个国外网站好毕设 网站开发的必要性
  • wordpress调用主站的文章wordpress百度xml地图
  • 郑州网站建设培训学校网站搭建计划书
  • 做网站公司排名网站策划界面效果感受心得
  • 银川市建设工程质量监督站网站个人域名网站可以做企业站吗
  • 网站建设方案doc网站设计及建设合同
  • 毕业设计用PHP做旅游网站晚上睡不着网站2021免费
  • 网站数据分析报表wordpress打赏可见插件
  • 济南做网站最好的单位常见的网络营销有哪些
  • 试用网站要怎么做wordpress 新变量
  • 都匀网站制作辽宁省建设网官网
  • iis7搭建aspx网站网站虚拟空间更新缓存
  • 建设公共资源交易中心网站wordpress手机版地址
  • 电商网站如何优化小学四年级摘抄新闻
  • 前端网站页面模板下载软件最全网站
  • 镇江做网站哪家公司好企业宣传册ppt模板
  • 瑞安市规划建设局网站怎么免费网上做公司网站
  • 给网站公司做网站建设部企业资质查询
  • 宁波小型建网站公司石家庄seo扣费
  • 柳州网站建设价格影楼和工作室的区别
  • 重庆网站建设专家软文推广代写代发
  • 上海网站设计哪家强四川省建设监理管理协会网站