当前位置: 首页 > news >正文

九江市做网站的公司把网站做静态化是什么意思

九江市做网站的公司,把网站做静态化是什么意思,平台公司代理注册,药品加工厂做网站【学而不思则罔,思维不学则怠】 本文总结一下常见的一些算法训练超参数调优思路(陆续总结更新),包括: batchsize学习率epochsdropout(待添加) Batch_size 2023.9.29 简单来说,较…

【学而不思则罔,思维不学则怠】

本文总结一下常见的一些算法训练超参数调优思路(陆续总结更新),包括:

  • batchsize
  • 学习率
  • epochs
  • dropout(待添加)

在这里插入图片描述

Batch_size

2023.9.29

  • 简单来说,较大的bz可以加快训练速度,特别是基于GPU进行模型训练时,应该在显存允许范围内,尽量使用较大的bz。
  • 两个极端:假设内存/显存足够大,每次都是使用全量数据进行梯度计算,此时训练效率最高,但训练极容易陷入鞍点(局部最优)而无法跳出,表现出来就是loss还比较高,但是已经开始收敛了。
  • 但bz不是说越大越好,越大bz意味着用更多的数据来计算梯度,越容易陷入鞍点,但若batch数量较多,则当一个batch的数据使算法陷入鞍点了,另一个batch的数据有机会使算法跳出鞍点。
  • 因此bz尽可能选大一些,同时保证batch数量不太少,最简单的方法就是从GPU显存或CPU内存运行的最大值开始实验,若发现出现了loss过早收敛且比较高时(陷入鞍点),此时则放弃充分利用GPU,而应考虑减少bz,使loss能够继续下降。
  • 结论:从显存/内容利用率角度和防止陷入鞍点两个角度来思考bz。

学习率

2024.1.16

  • lr若太大,则会导致训练波动,不容易收敛,表现出来就是算法的loss在下降一段时间后,又突然增加,然后又下降,然后有增加,就像乒乓球落地上,弹弹弹。loss曲线并不光滑,如锯齿版的下降(就像下图的样子)。甚至始终无法收敛。
  • lr若太小,最大的问题就是需要更长的时间来进行收敛。
  • 对lr的设置除了经验值外,就是观看loss收敛情况。
    在这里插入图片描述

epochs

2024.1.16

  • 它就很简单了,先推荐设置一个较大的值,然后观察能收敛的epoch即可

dropout

待添加

http://www.yayakq.cn/news/56322/

相关文章:

  • 音乐网站建设费用软件开发和网站开发
  • 网站交互图片怎么做的青岛模板建站
  • 温州在线制作网站优秀简历模板
  • 哪个做砍价活动的网站好网站开发php和c语言区别
  • 衡州网站建设seo宝安区住房和建设局网站
  • 烟台高新区建设局网站小网站广告投放
  • 教育云平台网站建设河北网站开发哪家好
  • 正保建设工程教育网站凡科投票
  • 专注徐州网站开发衡水注册公司
  • 哪里可以学网站开发建设工程交易中心是什么
  • 网站静态化网上帮做一些小事赚零花钱的网站
  • 网站内容页301如何做如何建wap网站
  • 沧州做网站哪家公司好杭州微网站建设
  • 最经典最常用的网站推广方式企业网站排名优化公司
  • 为什么网站浏览不是做的那样网站标题栏做多大
  • 比较好的网站开发公司内部网站创建
  • 福州建设公司网站南宁网站关键词推广
  • 网站如何分页好推建站
  • 建设工程消防备案查询网站建设门户网站发展前景2018
  • 国内设计网站国外免费个人网站空间
  • 做企业的网站的如何推广商丘网站建设aliapp
  • 1m带宽做网站布吉网站建设价格
  • 手机可以建设网站吗中国建设监理企业协会网站
  • html 网站 模板中文网站接口设置
  • 长沙网站优化收费wordpress微信商城
  • 多语言 网站源码免费咨询师心理医生
  • 网站开发引发的官司新闻发稿
  • 柳州网站建设多少钱开发一个小程序游戏要多少钱
  • 英文案例网站网站建设的必要性’
  • 网站设计搜索栏怎么做网站做好后怎么做seo