当前位置: 首页 > news >正文

富阳网站设计天天游戏中心

富阳网站设计,天天游戏中心,apicloud成品源码,上海网站搜索优化🚩🚩🚩Hugging Face 实战系列 总目录 有任何问题欢迎在下面留言 本篇文章的代码运行界面均在PyCharm中进行 本篇文章配套的代码资源已经上传 从零构建属于自己的GPT系列1:数据预处理 从零构建属于自己的GPT系列2:模型训…

🚩🚩🚩Hugging Face 实战系列 总目录

有任何问题欢迎在下面留言
本篇文章的代码运行界面均在PyCharm中进行
本篇文章配套的代码资源已经上传

从零构建属于自己的GPT系列1:数据预处理
从零构建属于自己的GPT系列2:模型训练1
从零构建属于自己的GPT系列3:模型训练2
从零构建属于自己的GPT系列4:模型训练3

6 序列填充函数

def collate_fn(batch):input_ids = rnn_utils.pad_sequence(batch, batch_first=True, padding_value=5)labels = rnn_utils.pad_sequence(batch, batch_first=True, padding_value=-100)return input_ids, labels

7 损失计算函数

def caculate_loss(logit, target, pad_idx, smoothing=True):if smoothing:logit = logit[..., :-1, :].contiguous().view(-1, logit.size(2))target = target[..., 1:].contiguous().view(-1)eps = 0.1n_class = logit.size(-1)one_hot = torch.zeros_like(logit).scatter(1, target.view(-1, 1), 1)one_hot = one_hot * (1 - eps) + (1 - one_hot) * eps / (n_class - 1)log_prb = F.log_softmax(logit, dim=1)non_pad_mask = target.ne(pad_idx)loss = -(one_hot * log_prb).sum(dim=1)loss = loss.masked_select(non_pad_mask).mean()  # average laterelse:# loss = F.cross_entropy(predict_logit, target, ignore_index=pad_idx)logit = logit[..., :-1, :].contiguous().view(-1, logit.size(-1))labels = target[..., 1:].contiguous().view(-1)loss = F.cross_entropy(logit, labels, ignore_index=pad_idx)return loss

8 评价函数

def calculate_acc(logit, labels, ignore_index=-100):logit = logit[..., :-1, :].contiguous().view(-1, logit.size(-1))labels = labels[..., 1:].contiguous().view(-1)_, logit = logit.max(dim=-1)  # 对于每条数据,返回最大的index# 进行非运算,返回一个tensor,若labels的第i个位置为pad_id,则置为0,否则为1non_pad_mask = labels.ne(ignore_index)n_correct = logit.eq(labels).masked_select(non_pad_mask).sum().item()n_word = non_pad_mask.sum().item()return n_correct, n_word

9 训练过程解读

从零构建属于自己的GPT系列1:数据预处理
从零构建属于自己的GPT系列2:模型训练1
从零构建属于自己的GPT系列3:模型训练2
从零构建属于自己的GPT系列4:模型训练3

http://www.yayakq.cn/news/178265/

相关文章:

  • app开发网站建设包含项目vip影院自助建站系统
  • 枣强网站建设价格有帮忙做网站的吗
  • 做网站赚钱的点在哪里网页设计的原则
  • 在设计赚钱的网站wordpress 有道智云
  • 购买网站外链网站怎么做图片动态图片不显示不出来的
  • 网站建设公司咨大学it网页制作教程
  • 学生做网站赚钱贵阳哪家网站建设公司好
  • 网站开发团队名称免费网络翻外墙软件
  • 绍兴免费自助建站变装WordPress
  • 学校期末评语网站开发wordpress 禁止修订版本
  • 购物网站设计目标哪个网站可以帮人做ppt
  • 旅游公司网站建设方案网站后台数据处理编辑主要是做什么的啊
  • 备案网站查询网址wordpress 关键词设置
  • 襄阳网站建设公司一个月做网站
  • 怎样做电影网站山西网站推广
  • 网站如何进行代码优化房地产网站建设与优化分析
  • 深圳建站公司如何进行在线营销
  • 公益网站建设分析wordpress主题图片路径设置
  • 乐陵人力资源网站wordpress 链接格式
  • 金坛城乡建设管理网站深圳市宝安区邮编
  • 网站托管就业网站建设微信公众号文章
  • 网站做vr的收费青州网站设计公司
  • 网站诊断案例讷河做网站公司
  • 广东律师事务所东莞网站建设wordpress手机怎么使用
  • 网站建设登录结构图wordpress下载不了
  • 网站导航设计图片搞钱的路子网站
  • 南京网站制作链接医疗器械商标
  • 成都网站优化方式公关公司电视剧
  • 做家装的网站有哪些内容集团网站群建设
  • 做破解软件网站赚广告费郑州企业建网站制作