当前位置: 首页 > news >正文

网站架设地址在家做十字绣兼职网站

网站架设地址,在家做十字绣兼职网站,做教育业网站,陕西省建设网企业库部署环境 系统:CentOS-7CPU: 14C28T显卡:Tesla P40 24G驱动: 515CUDA: 11.7cuDNN: 8.9.2.26目的 验证P40部署可行性,只做验证学习lora方式微调创建环境 conda create --name glm-tuning python3.10 conda activate glm-tuning克隆项目 git clone http…

部署环境

  系统:CentOS-7CPU: 14C28T显卡:Tesla P40 24G驱动: 515CUDA: 11.7cuDNN: 8.9.2.26

目的

验证P40部署可行性,只做验证学习lora方式微调

创建环境

conda create --name glm-tuning python=3.10
conda activate glm-tuning

克隆项目

git clone https://github.com/hiyouga/ChatGLM-Efficient-Tuning
cd ChatGLM-Efficient-Tuning

安装依赖

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

准备数据-少量测试-项目已提供分词好数据

准备数据
我们将下载好的数据集解压到 data 文件夹中,解压后的文件目录为:
data/
├── dataset_info.json
└── self_cognition/
├── dev.json
└── train.json
接下来,我们修改 dataset_info.json,增加以下两列内容,从而使训练框架能够识别自定义数据集。
测试dev.json与train.json一样的,生产环境需要分离,
"self_cognition_train": {"file_name": "self_cognition/train.json","columns": {"prompt": "content","query": "","response": "summary","history": ""}
},
"self_cognition_dev": {"file_name": "self_cognition/dev.json","columns": {"prompt": "content","query": "","response": "summary","history": ""}
}

微调代码调整

accelerate launch src/train_bash.py \--stage sft \--do_train \--model_name_or_path  /models/chatglm2-6b \--dataset self_cognition_train \--finetuning_type lora \--output_dir self_cognition_lora \--overwrite_cache \--per_device_train_batch_size 2 \--gradient_accumulation_steps 2 \--lr_scheduler_type cosine \--logging_steps 10 \--save_steps 1000 \--learning_rate 1e-3 \--num_train_epochs 2.0 \--lora_rank 32 \--ddp_find_unused_parameters False \--source_prefix 你现在是一名销售员,根据以下商品标签生成一段有吸引力的商品广告词。 \--plot_loss \--fp16
如果调整了数据集,要清理缓存,缓存目录如下
/root/.cache/huggingface/datasets
Tue Aug  1 10:45:02 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P40           Off  | 00000000:03:00.0 Off |                    0 |
| N/A   61C    P0   184W / 250W |  13503MiB / 23040MiB |     94%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
{'train_runtime': 73.3871, 'train_samples_per_second': 2.18, 'train_steps_per_second': 0.545, 'train_loss': 1.7150115966796875, 'epoch': 2.0}                                    
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [01:13<00:00,  1.83s/it]***** train metrics *****epoch                    =        2.0train_loss               =      1.715train_runtime            = 0:01:13.38train_samples_per_second =       2.18train_steps_per_second   =      0.545

参数:参数根据自己硬件配置自己调整
温度:P40自己改个风冷散热,散热效果不好,奔着80度去了
显存:占用大概14G

模型测试

CUDA_VISIBLE_DEVICES=0 python src/cli_demo.py \--model_name_or_path  /models/chatglm2-6b \--checkpoint_dir self_cognition_lora
python src/web_demo.py --checkpoint_dir self_cognition_lora --model_name_or_path  /models/chatglm2-6b

Input: 你是谁
ChatGLM-6B: The dtype of attention mask (torch.int64) is not bool
我是AI小木,一个由小吕开发的人工智能助手,我可以回答各种问题,提供信息,甚至进行闲聊。

Input: 你是谁开发的
ChatGLM-6B: 我不是开发的,是由小吕开发的人工智能助手,旨在为用户提供有用的回答和帮助

总结

效果还行,我的参数都设置的比较小,速度挺快的2分钟,模型微调之后认识已经调整过来了
后面准备调整更大数据集,再做数据评测

–model_name_or_path /models/chatglm2-6b 注意指定

参考

https://hub.nuaa.cf/hiyouga/ChatGLM-Efficient-Tuning/blob/main/examples/ads_generation.md
http://www.yayakq.cn/news/536808/

相关文章:

  • 高州网站开发公司学校建设网站费用申请报告
  • 做网站能用假图片吗怎么建自己的摄影网站
  • 网站建设文化如何网站联盟是什么意思
  • 网站首页设计图广州公司注册查询
  • 深圳建设网站公做办公用品网站资料怎么收集
  • 住建局网站信息化建设外贸保健品wordpress主题商城
  • 京东网站设计分析网站建设情况 报告
  • 青岛网站seo公司莆田网站建设网
  • 数据分析对网站建设的重要性网站怎么做 流程图
  • 做直播网站用什么程序记事本怎么做网站
  • 保健品 东莞网站建设做书评的网站
  • 有没有可以免费做试卷的网站_最好可以学会...深圳 网站开发
  • 北京网站建设一条龙阿里云做电影网站
  • 登陆国外的网站要这么做娱乐城网站建设
  • 上海网络做网站公司江阴安泰物流有限公司网站谁做的
  • 广东建设网证件查询黑帽seo是什么意思
  • 买源码做网站简单嘛滨州论坛网站建设
  • 现在网站还用asp做网站开发导航
  • wordpress禁止外链廊坊首页霸屏优化
  • 做相册网站中国空间站有多大
  • .net 网站关键字架设仿冒网站挂马
  • 网站搭建学什么软件兼职开发网站开发
  • 江都区城乡建设局网站马局网页设计与制作学什么
  • 如果做网站运营2022最新泛站群程序
  • 网站推广方案书主机屋wordpress建站
  • 巩义建设网站网站开发 毕业答辩ppt
  • 校园网站建设管理及责任表泊头网站优化
  • 网站建设中页面源码2024小学生时事新闻十条
  • 泉州网站建设公司推荐做个淘宝客网站怎么做的
  • 网站优化推广培训好的网站建设公司哪家好