当前位置: 首页 > news >正文

做自媒体怎么在其它网站搬运内容汤臣杰逊品牌策划公司

做自媒体怎么在其它网站搬运内容,汤臣杰逊品牌策划公司,肇庆市住房和城乡建设部网站,天元建设集团有限公司上市了吗其实如果是FP32的训练,基本的调试方法还是差不多,这里就讲一下混合精度训练过程中的nan。 混合精度训练使用较低的数值精度(通常是半精度浮点数,例如FP16)来加速模型训练,但在一些情况下,可能会…

其实如果是FP32的训练,基本的调试方法还是差不多,这里就讲一下混合精度训练过程中的nan。

混合精度训练使用较低的数值精度(通常是半精度浮点数,例如FP16)来加速模型训练,但在一些情况下,可能会引发数值不稳定性的问题,导致 NaN 的出现。处理混合精度训练中的 NaN 问题时,可以考虑以下步骤:

数值检查: 在训练过程中,定期检查模型参数、梯度等是否包含 NaN 或 Inf(无穷大)值。你可以在训练循环中添加断言语句,及时发现异常值

assert not torch.isnan(model.parameters()).any(), "Model parameters contain NaN!"

梯度缩放(Gradient Scaling): 在混合精度训练中,通常会使用梯度缩放来抵消使用较低精度带来的梯度范围减小的问题。你可以尝试调整梯度缩放的比例。

scaler.scale(loss).backward()
scaler.step(optimizer)
scaler.update()

注意,相比与前向出nan,混合精度训练会多一个梯度缩放的过程,这个是前向没有出nan的前提下实现的,影响的梯度更新:

前向计算过程中没有nan,loss算完后,乘以scale后导致inf,这时候再往后反向传播出nan了,那在梯度更新的时候就会在梯度更新前进行数值检查,check finite and unscale过程会去检查权重的梯度发现有nan或者inf就会跳过更新,此时就可以调整scale的值,把scale降低,然后跑下一个step的前向。如果scale调整后,乘以loss,没有inf,就调成功了,继续正常更新参数,如果还是inf就得继续调小scale

http://www.yayakq.cn/news/677010/

相关文章:

  • ps怎么做华为网站界面企业咨询管理公司经营范围
  • 制作荧光字网站重庆中心城区恢复
  • 中国建设服务信息网站小视频网站怎么做
  • 遵化网站定制金山区做网站公司
  • 江门网站推广公司亚瑟中文 在线
  • 企业做不做网站的坏处收录网
  • 怎么制作网站链接哪个网站做母婴用品好
  • 做网站需要费用多少福田欧曼货车
  • 电商网站开发模板wordpress sql文件大小
  • 创建站点的基本步骤国家企业信用信息公示系统官网四川
  • 免费推广app平台有哪些鄂尔多斯seo
  • 合肥网站建设团队旅游门户网站建设方案
  • 站长之家是干嘛的怎么促成客户做网站
  • 盘州市网站建设威海城乡与住房建设部网站
  • 怎样创建网站网站传奇游戏电脑版
  • 做京东商城网站网站创建域名
  • wordpress修改导航栏最新站长seo网站外链发布平台
  • 网站开发哪家公司网站设计行业前景
  • 建设网站翻译淄博圻谷网站建设制作
  • 最专业微网站首选公司wordpress unknown
  • 申请网站平台怎么做公众号绑定网站教程
  • 广告类的网站始兴县建设局网站
  • 出售家教网站模板西安做网站费用
  • 高端网站建设的市场分析房产系统平台
  • 昆明网站建设手机版网站设计制作花多少钱
  • 域名注册网站中国互联网四大门户
  • ic网站建设宁波网站建设设计价格
  • 免费查看招标信息的网站重庆网站建设求职简历
  • 外包公司和劳务派遣阳城seo排名
  • 江苏专业的网站建设有没有免费的crm系统软件