当前位置: 首页 > news >正文

服务器两个域名一个ip做两个网站吗二手房网站平台怎么做

服务器两个域名一个ip做两个网站吗,二手房网站平台怎么做,阿里云这么建设网站,关于公司网站的建设的问卷一、原因 神经网络梯度 假设现在有一个 层的神经网络,每层的输出为一个对输入作 变换的函数结果 用 来表示第 层的输出,那么有下列公式: 链式法则计算损失 关于某一层某个参数 的梯度: 注意到, 为向量&am…

一、原因

神经网络梯度

· 假设现在有一个 d 层的神经网络,每层的输出为一个对输入作 f_t 变换的函数结果

· 用 h^t 来表示第 t 层的输出,那么有下列公式:

h^t = f_t(h^{t-1})

· 链式法则计算损失 l 关于某一层某个参数 w_t 的梯度:

\frac{\partial l}{\partial w_t}=\frac{\partial l}{\partial h^d}\frac{\partial h^d}{\partial h^{d-1}}...\frac{\partial h^t}{\partial w_t}

· 注意到,h^t 为向量,这相当于一个 d-t 次的矩阵乘法

这个传递可能造成以下问题:

· 假设每次的梯度为1.5,但随着神经网络的规模变大,往后传递过去可能就有 1.5^{100}=4*10^{17} 这么大,从而产生梯度爆炸。

· 假设每次的梯度为0.8,同样的道理,传递过去可能有 0.8^{100}=2*10^{-10} 这么小,从而使模型最后的变化幅度很小,出现梯度消失。

二、梯度消失

假设用sigmoid函数作为激活函数

· 导数的问题是,当输入相对较大或者较小时,求导计算之后,每次向上传递的梯度会变得很小

· 累乘起来之后,这个值可能就会变得更小

可能造成的问题:

· 梯度值非常接近0,使得模型无法训练,每次训练改变幅度非常小

· 在神经网络较深时,对于底部层尤为严重

        · 反向传播时,顶部的训练可能较好,拿到的梯度较正常

        · 越到底部,梯度越小,底部层无法训练,使得神经网络无法变深

三、梯度爆炸

假设我们使用ReLU函数作为隐藏层的激活函数

· ReLU激活函数的导数会使大于0的输出求导后都是1,小于等于0的输出求导后都是0

· 首先将链式法则的求导公式代入ReLU激活函数转化一下,得到下式

· 这时,h^{t-1} 与 w_t 相乘后再在ReLU函数里求导的结果就是0或1,那么每次传递的就是 w_t 转置值

· 如果中间层 d-t 很大,那么最后累乘的结果就会很大,最终导致梯度爆炸

可能造成的问题:

· 值超过上限(如16位浮点数,可能数值上溢)

· 对学习率非常敏感

        · 若学习率较大—大参数值—更大的梯度

        · 若学习率较小—训练效果小

        · 需要不断调整学习率

http://www.yayakq.cn/news/951716/

相关文章:

  • 常州做网站麦策电商中国seo公司
  • 建设网站选题应遵循的规则市场调研报告范文大全
  • 小说网站排名前十网站运营推广
  • 备案不关闭网站网站里的动态是如何制作
  • 门户网站建设方案文档深圳市做网站
  • 网站建设 网络科技公司网店网站建设的步骤过程
  • 九九建站-网站建设 网站推广 seo优化 seo培训慕课网站开发与实现
  • 钓鱼网站网址大全网站建设合同详细
  • wordpress建小说网站企业产品网络推广
  • 网站建设律师wordpress首页小工具
  • 网站策划书背景介绍广德县住房和城乡建设网站
  • 云南建设厅官方网站信阳网
  • 怎么注册网站账号平台app如何推广
  • 龙游网站建设的公司肃宁县网站建设价格
  • 营销型网站的类型有哪些WordPress插件代码化
  • 青田建设局网站.gs域名做网站怎么样
  • 网站怎么做双机房切换wordpress .less
  • 公司网站未备案吗重庆有哪些建设公司
  • 做热图的网站建筑设计公司名字起名大全
  • 深圳网站快速优化公司济南手机建站哪家好
  • 备案域名绑定网站建一个网站的手机电脑
  • 阳朔到桂林汽车时刻表seo优化方案执行计划
  • 婚庆网站的设计意义广州市手机网站建设公司
  • 网站开发网页跳转到新的页面建设网站时 首先要解决两个问题 一是什么
  • 网站开发模式有哪些手机下载网页视频
  • 山东卓创网络网站建设京东网站建设策划书
  • 做php网站阿里云服务器个人网站的设计与实现主要技术指标
  • 学校网站怎么做的好处没有网站可以做淘宝客
  • 江门网站设计富阳有没有做网站的
  • 焦作市网站建设哪家好自己建服务器做网站违法