当前位置: 首页 > news >正文

网站建设及 维护电子产品外贸交易平台

网站建设及 维护,电子产品外贸交易平台,企业信息港网站建没,黄页群发软件1.RMS Normalization的原理 说RMS Normalization之前#xff0c;先讲Layer Normalization 和 Batch Normalization。 BN和LN是两种常见的归一化方法。它们的目的是帮助模型训练更稳定、收敛更快。BN是在Batch维度上进行归一化#xff0c;即对同一batch中每个特征维度的值进行…1.RMS Normalization的原理 说RMS Normalization之前先讲Layer Normalization 和 Batch Normalization。 BN和LN是两种常见的归一化方法。它们的目的是帮助模型训练更稳定、收敛更快。BN是在Batch维度上进行归一化即对同一batch中每个特征维度的值进行归一化。LN则是在层的维度上进行归一化即对每一个样本的特征进行归一化。 RMS Normalization属于LN。 再来说RMS Normalization和Layer Normalization。 Layer Normalization利用均值和方差对特征进行归一化。 RMS Normalization利用均方根对特征进行归一化。 LLaMA架构中采用RMS Normalization的原因是通过只计算均方根从而减少计算量同时在实验中也确实获得了更加稳定的训练。 在这里插入一点NLP任务中对于将特征进行“归一化”目的的一些个人小理解在NLP中使用Layer Normalization进行归一化是为了使输入特征在每一层的神经元中保持稳定的分布避免特征值之间出现过大的波动。通过归一化Layer Normalization 将特征重新调整为均值为 0、方差为 1 的分布从而让模型的训练更加稳定和高效使得数据变得更加“平滑”。这里的“平滑”是指数值的尺度更一致、更稳定不会有特别大的数值差异能够防止特征值在网络层中传递时变得过大或过小。这种一致性有助于缓解模型训练中的一些问题如梯度爆炸或梯度消失并能让模型更容易优化。在使用RMS Normalization进行归一化则是直接使特征本身的数值变得更加“平滑”。 2.RMS Normalization公式 2.RMS Normalization的实现 该函数在神经网络中需要对输入的数据进行处理再输出相应的处理好的数据对应的实现方式就用层来实现。 因为RMS Normalization属于LN所以x--[batch_size, hidden_states] import torchclass RMSNorm(torch.nn.Module): # nn.Module是所有层的父类层元素就必须继承nn.Moduledef __init__(self, dim, eps): # 用于储存层的元素super().__init__()self.weight torch.nn.Parameter(torch.ones(dim)) # 初始化权重参数self.eps eps # 防止根号下为0def _norm(self, x): # 定义类函数里的方法_表示只在该类的内部调用return x * torch.rsqrt(x.pow(2).mean(-1, keepdimTrue) self.eps)# x.pow(2)求平方# x.pow(2).mean(-1, keepdimTrue)所有的平方求一个均值# x.pow(2).mean(-1, keepdimTrue) self.eps加上一个防止根号下为0的元素# torch.rsqrt(x.pow(2).mean(-1, keepdimTrue) self.eps)开平方再求导# rsqrt(x) 1 / sqrt(x)# x * torch.rsqrt(x.pow(2).mean(-1, keepdimTrue) self.eps)最后用求得的导数乘以xdef forward(self, x): # 数据流output self._norm(x.float().type_as(x)) # 将x变成浮点数进行归一化并保持x原始的数据类型return output * self.weight # 将归一化后的输出乘以可学习的参数 weight,调整每一个维度的缩放if __name__ __main__:batch_size 1dim 4 # 特征维度x torch.Tensor([0.1, 0.1, 0.2, 0.3])# 初始化RMSNorm对象rms_norm RMSNorm(dimdim, eps0)output rms_norm(x)print(输入数据: \n, x)print(RMSNorm输出数据: \n, output)
http://www.yayakq.cn/news/1425/

相关文章:

  • 微网站免费开发平台手机优化助手怎么删除
  • 北京网站建设公司司文创产品设计作品欣赏
  • 网站撤销备案个人怎么注册公司需要多少钱
  • 网站专题页面设计欣赏wordpress网站如何app
  • 自己做的视频可以传别的网站去吗广州商务网站建设电话
  • 提供网站建设服务菜谱分享网站开发开题报告
  • 怎么制作网站布局erp软件开发
  • 外国做袜子的网站ueditor wordpress 4.5
  • HTML怎么做网站目录青岛做网站价格
  • 哪个市文化和旅游网站做的好大网站
  • 查询网站中国摄影展览网首页
  • 外贸网站建设 广州企业网站的域名是该企业的
  • 响水哪家专业做网站怎样查网站的注册地点
  • 企业做网站公司怎么样天琥设计培训学校官网
  • 芒市网站建设公司青岛有没有做网站的
  • 做网站文字编辑累吗用源码做自己的网站
  • 网站建设风景课程设计报告深圳网站设计比较好的公司有哪些
  • 网站页面优化分析网站代理浏览器一
  • 企业网站建站系统网站宣传需要多少钱
  • 做h5页面网站有哪些域名多少钱一年
  • 深圳中高端网站建设怎么样网站建设服务器 几核
  • 腾讯云域名备案需要提供网站建设方案书怎么建立一个公众号
  • 网站建设公司哪家好智搜宝微信公众号被收费299
  • 可信赖的扬中网站建设江苏缘生源建设工程有限公司网站
  • 没有虚拟主机怎么建网站专业优定软件网站建设
  • 怎么做公司销售网站wordpress添加幻灯片
  • 工程公司手机网站wordpress调用最近发布的文章
  • 怎样优化网站自然排名慈溪建设网站
  • 武隆专业网站建设公司怎么用软件做原创视频网站
  • 购物网站html代码东莞网站搭建建站公司