当前位置: 首页 > news >正文

滨州做网站的公司千锋教育成立于哪一年

滨州做网站的公司,千锋教育成立于哪一年,安徽外贸网站google建站,蝴蝶传媒网站推广问题描述: 内存泄漏积累过多最终会导致内存溢出,当内存占用过大,进程会被killed掉。 解决过程: 在代码的运行阶段输出内存占用量,观察在哪一块存在内存剧烈增加或者显存异常变化的情况。但是在这个过程中要分级确认…

问题描述:

内存泄漏积累过多最终会导致内存溢出,当内存占用过大,进程会被killed掉。

解决过程:

在代码的运行阶段输出内存占用量,观察在哪一块存在内存剧烈增加或者显存异常变化的情况。但是在这个过程中要分级确认问题点,也即如果存在三个文件main.py、train.py、model.py。
在此种思路下,应该先在main.py中确定问题点,然后,从main.py中进入到train.py中,再次输出显存占用量,确定问题点在哪。随后,再从train.py中的问题点,进入到model.py中,再次确认。如果还有更深层次的调用,可以继续追溯下去。

import psutil
process = psutil.Process()
current_memory = process.memory_info().rss
print(f"0--------------Current memory usage: {current_memory / (1024 ** 3):.4f} GB")

具体使用的代码

for epoch in range(start_epoch+1, args.epochs+1):process = psutil.Process()current_memory = process.memory_info().rssprint(f"0--------------Current memory usage: {current_memory / (1024 ** 3):.4f} GB")count_step = (epoch-1)*len(train_loader)  print(f"1--------------Current memory usage: {current_memory / (1024 ** 3):.4f} GB")mean_loss, lr = train_one_epoch(model, optimizer, train_loader, device, epoch, count_step,writer,lr_scheduler,print_freq=args.print_freq)print(f"2--------------Current memory usage: {current_memory / (1024 ** 3):.4f} GB")val_info = evaluate_vgg(model, epoch, val_loader, device, writer, num_classes=num_classes)print(f"3--------------Current memory usage: {current_memory / (1024 ** 3):.4f} GB")with open(results_file, "a") as f:# 记录每个epoch对应的train_loss、lr以及验证集各指标       train_info = f"[epoch: {epoch}]\n" \f"train_loss: {mean_loss:.4f}\n" \f"lr: {lr:.6f}\n"f.write(train_info + val_info + "\n\n")save_vgg_file = {"model": model.state_dict(),"optimizer": optimizer.state_dict(),#  "lr_scheduler": lr_scheduler.state_dict(),"epoch": epoch,"args": args}torch.save(save_vgg_file, 'checkpoints/fcn_model_Adam-StepLR_1e-2.pth')print(f"update checkpoints/fcn_model_Adam-StepLR_1e-2.pth")print(f"4--------------Current memory usage: {current_memory / (1024 ** 3):.4f} GB")

在这里插入图片描述
每个epoch训练完之后所占内存会不断增加,也就是说,每轮跑完之后会有冗余的数据一直在消耗内存。于是criterion、train_one_epoch、evaluate三个部分

criterion部分
Mem usage:5310 MiB在这里插入图片描述train_one_epoch部分
Mem usage:4439 MiB
在这里插入图片描述
evaluate部分
Mem usage:10644
在这里插入图片描述
在这里插入图片描述
evaluate部分可以看到,所占用内存突然增大,并且之后的代码也占用了大量内存,继续监控得知在下一个epoch中criterion部分占用内存也是16064MiB,由此推测出内存消耗在evaluate部分

解决办法:

删除变量数据在for循环外,把暂时不用的可视化代码注释掉,发现占用内存变化很小
在这里插入图片描述
在这里插入图片描述

解决pytorch训练时的显存占用递增的问题
Pytorch训练过程中,显存(内存)爆炸解决方法
Python代码优化工具——memory_profiler

http://www.yayakq.cn/news/540759/

相关文章:

  • 做网站实名认证总是失败怎么回事乐清人才网
  • 视频网站公共关系怎么做望野诗
  • 四川建设部网站官网免费制作永久网站
  • 做网站的条件智库网站建设方案
  • 胶州家园网站建设单位的网站的建设方案
  • php网站开发软件asp化妆品网站 后台
  • 廊坊做网站厂商定制长沙网页设计培训服务好长沙大计校区
  • 网站文章做百度排名网站建设专属名词
  • 花店网站模板免费下载天眼查 企业查询官网
  • 泰州建设网站全网推广服务
  • 海南网站优化吧网站做软件的软件下载
  • 网站建设实训 课程标准海门市规划建设局网站
  • 西宁市城东区住房和建设局网站网络营销的优势
  • 广东公司响应式网站建设设计广州网站建设:
  • 网站咨询聊天怎么做域名 a记录 手机网站
  • 网站备案掉了什么原因cnzz wordpress
  • 徽石网站建设建筑工程网是什么网站
  • 网站建设职业怎么样网站建设中企动力公司
  • 网站静态化的好处湖州建设企业网站
  • 做淘宝这样的网站需要什么郑州设计师网站
  • 秦皇岛做网站哪家好公司网站制作工作室
  • 网站主题编辑工具WordPress大数据营销方法
  • p2f网站系统昆明pc网站建设
  • 网站建设旗舰品牌南召seo快速排名价格
  • 网页设计与网站开发pdf谷歌网站地图提交
  • 固安县城乡和住房建设局网站班级优化大师简介
  • 做网站有哪些项目网站建设推广怎样找客户
  • 360弹出网站生产企业网站有哪些
  • 企业网站改版价格wordpress菜单外链
  • 专做女鞋的网站代发广州著名食品包装设计的案例