当前位置: 首页 > news >正文

漳州网站建设优化排名安徽建设工程信息平台

漳州网站建设优化排名,安徽建设工程信息平台,有什么可以做试卷题目的网站,建设银行软件官方网站模型 transformers模型是使用比较多的模型,奈何各个都是体积大,找了一个使用人多不是很大的模型进行训练。 需要魔法 bert-base-uncased模型仓库地址 huggingface下的所有仓库都是git的,也就意味着你可以使用 git clone 可以下载仓库内所有的…
模型

transformers模型是使用比较多的模型,奈何各个都是体积大,找了一个使用人多不是很大的模型进行训练。
需要魔法
bert-base-uncased模型仓库地址
huggingface下的所有仓库都是git的,也就意味着你可以使用 git clone 可以下载仓库内所有的东西

硬件

本机并没有显卡,公司电脑是 i5 - 10500, 内存32GB

需要下载的库

conda有的库没有,需要下载
json os wandb datasets transformers

注意事项

1,库下载到本地后,在python中引用需要加载父级地址
os.environ["HF_MODELS_HOME"] = "E:\\data\\ai_model\\"

2,需要使用 wandb 进行训练记录,如果不写的话会报错。
wandb地址 wandb官网
3,需要设置对本地单个dll库的设置
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

最后,附上代码

import json
import os
import wandb
from datasets import Dataset
from transformers import BertTokenizer, BertForQuestionAnswering, Trainer, TrainingArgumentsos.environ["HF_MODELS_HOME"] = "E:\\data\\ai_model\\"
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"aip_key = '98b420c1ea905e27b7885b3d4205832fbef6874f'
# 1.连接 可以写在命令行,也可以写在代码中,只要在代码运行之前运行过即可,这里是代码中的实现
wandb.login(key=aip_key)
# 2.初始化wandb对象,主要用到6的几个参数
runs = wandb.init(project="wandb_study",# name=f"experiment",notes="这是一次test",tags=["test", "Test"]
)
# 3.初始化config
# Capture a dictionary of hyperparameters
wandb.config = {"epochs": 100, "learning_rate": 0.001, "batch_size": 128}# 4.找到相应数据并添加,一般的字符串、整形、浮点型直接用字典的形式就可以,图片前面要加wandb.Image()解析成wandb的形式,表格,summary见8和9
# wandb.log({"accuracy": step_acc,
#            "loss": train_loss.item(),
#            'images': wandb.Image(images[0]),
#            })# 数据准备
def read_json():json_data = '''[{"question": "What is the Apollo program?","context": "The Apollo program was the third human spaceflight program carried out by NASA...","answer": "The Apollo program was the third human spaceflight program carried out by NASA"}]'''data = json.loads(json_data)# 将数据转换为Dataset对象# 转换数据格式dataset_dict = {"question": [item["question"] for item in data],"context": [item["context"] for item in data],"answer": [item["answer"] for item in data]}# 创建Dataset对象dataset = Dataset.from_dict(dataset_dict)print(dataset)return dataset# 定义数据预处理函数,将输入数据转换为模型可用的格式
def preprocess_function(examples):inputs = tokenizer(examples["question"],examples["context"],max_length=512,truncation=True,return_tensors="pt",padding="max_length")start_positions = []end_positions = []for i, answer in enumerate(examples["answer"]):start_pos = examples["context"][i].find(answer)end_pos = start_pos + len(answer)start_positions.append(start_pos)end_positions.append(end_pos)inputs.update({"start_positions": start_positions,"end_positions": end_positions})return inputs# 设置训练参数并初始化Trainer对象
def trainer_training(model):processed_dataset = dataset.map(preprocess_function, batched=True)training_args = TrainingArguments(output_dir='./results',run_name='my_experiment',  # 设置一个不同于 output_dir 的 run_namenum_train_epochs=3,per_device_train_batch_size=8,per_device_eval_batch_size=8,warmup_steps=500,weight_decay=0.01,logging_dir='./logs',logging_steps=10,eval_strategy="steps",  # 使用 eval_strategy 替代 evaluation_strategy)return Trainer(model=model,args=training_args,train_dataset=processed_dataset,eval_dataset=processed_dataset,)if __name__ == '__main__':dataset = read_json()model_name = "bert-base-uncased"tokenizer = BertTokenizer.from_pretrained(model_name)model = BertForQuestionAnswering.from_pretrained(model_name)trainer = trainer_training(model)# 开始训练模型trainer.train()# 保存训练后的模型output_model_dir = "./trained_model"  # 这是一个文件夹,下面有三个文件 config.json model.safetensors training_args.binos.makedirs(output_model_dir, exist_ok=True)trainer.save_model(output_model_dir)

引用资料:
wandb的基本使用

http://www.yayakq.cn/news/856838/

相关文章:

  • 中英文 微信网站 怎么做谷歌浏览器下载手机版最新版
  • 网站开发制作公司做网站如何防止被黑
  • 威海网站建设费用一般做推广网站的客户需求仕什么
  • 做网站的商标是哪类通辽做网站哪家好
  • 建设设计网站公司网站做网站放什么软件
  • 网站首屏做多大怎么查询菠菜网站做没作弊
  • 重庆企业网站建设哪家好新开传奇网站韩版
  • 网站开发要考什么证优秀html5网站
  • 专业定制网站建设it运维证书
  • 我要表白网站在线制作高端企业门户网站建设
  • 学校网站建设介绍范文网页设计作品html
  • wordpress 主题 保存临沂seo全网营销
  • 怎么进成品网站后台wordpress 出现广告
  • 网站建设管理工作范文关于网站建设方案的案例
  • 外贸网站架构seo技术是什么意思
  • 有什么好的手机推荐网站做网站用什么ui美观
  • 转转网站怎么建设中国通信建设协会网站
  • 做网站的销售话术私域流量代运营公司
  • 天眼查询个人seo公司哪家好用
  • 雅安市住房和城乡建设局网站如何优化关键词的排名
  • 国内wordpress案例专业黑帽seo推广
  • 营销型网站方案广告平台投放广告
  • 贵州网站推广公司手机百度收录网站吗
  • 柳州网站建设多少钱网站有做货
  • 东营两学一做网站网站开发说明文档
  • 陕西省城乡建设厅网站呼和浩特企业网站建设
  • 设计高端网站网络营销的企业有哪些
  • 哪个网站可以做竖屏福州网站制作计划
  • 电子商务网站建设策划书的流程建网站需要什么
  • 焊枪公司网站怎么做免费空间网站推荐