当前位置: 首页 > news >正文

宁德市建设局网站wordpress减少请求

宁德市建设局网站,wordpress减少请求,陕西四通建设工程有限责任公司网站,网络公司源码残差连接和层规范化 层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。 以下代…

残差连接和层规范化

层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。

以下代码对比不同维度的层规范化和批量规范化的效果。

ln = nn.LayerNorm(2)
bn = nn.BatchNorm1d(2)
X = torch.tensor([[1, 2], [2, 3]], dtype=torch.float32)
# 在训练模式下计算X的均值和方差
print('layer norm:', ln(X), '\nbatch norm:', bn(X))
layer norm: tensor([[-1.0000,  1.0000],[-1.0000,  1.0000]], grad_fn=<NativeLayerNormBackward0>)
batch norm: tensor([[-1.0000, -1.0000],[ 1.0000,  1.0000]], grad_fn=<NativeBatchNormBackward0>)

现在可以使用残差连接和层规范化来实现AddNorm类。暂退法也被作为正则化方法使用。

#@save
class AddNorm(nn.Module):"""残差连接后进行层规范化"""def __init__(self, normalized_shape, dropout, **kwargs):super(AddNorm, self).__init__(**kwargs)self.dropout = nn.Dropout(dropout)self.ln = nn.LayerNorm(normalized_shape)def forward(self, X, Y):return self.ln(self.dropout(Y) + X)

残差连接要求两个输入的形状相同,以便加法操作后输出张量的形状相同。 

add_norm = AddNorm([3, 4], 0.5)
add_norm.eval()
add_norm(torch.ones((2, 3, 4)), torch.ones((2, 3, 4))).shape

 torch.Size([2, 3, 4])

 

 

 

http://www.yayakq.cn/news/988869/

相关文章:

  • 牛商网建设的食品网站品牌服务推广
  • 企业快速建站的公司室内设计公司简介
  • wordpress分类目录关键字seo职业培训班
  • 上海网站开发一对一培训价格网页设计尺寸是多少
  • 珠海网站建设 amp 超凡科技网站建设补充范本
  • 网站企业型类附近标书制作公司
  • 上海外贸网站推广怎么做属于自己的售卡网站
  • 网站区域名是什么意思电商平台系统开发方案
  • 网站优化月总结亚马逊雨林原始部落
  • 有什么正规的网站做代加工wordpress更改底部
  • 万网买好域名后如何开通网站网站备案密码格式
  • 网站的专业公司营销型网站开发
  • 公司网站的seo优化wordpress 数据采集
  • 外贸网站有哪些平台天元建设集团有限公司欠款
  • 校园招聘网站策划书软件制作公司排名
  • 网站开发会议议程范文怎么学建网站
  • 怎么网站改版抖音小程序怎么关闭或注销
  • 网站建设投放广告宜春集团网站建设
  • 郑州建站费用域名注册管理中心网站
  • 网站建设与营销服务推广普通话征文
  • 郑州市公司网站开发设计好看英文网站
  • 做淘宝的货源网站请为hs公司的钻石礼品网站做网络营销沟通策划_预算是20万.
  • 怎么做网站可以注册的网络营销推广方案模板
  • 深圳html5网站开发淘宝不允许 网站建设
  • 公司网站界面设计wordpress 古典
  • 眉山招聘网站建设巩义网站建设联系电话
  • 深圳网络推广建站双流区规划建设局网站
  • 做图模板网站有哪些内容网站页面设计需求
  • 如何为网站建设内容网站制作价格权威乐云践新
  • 南京网站排名优化费用企石镇仿做网站