当前位置: 首页 > news >正文

新乡手机网站建设官网国产服务器厂商排名

新乡手机网站建设官网,国产服务器厂商排名,一共有多少网站,wordpress前台无法访问这里写自定义目录标题 介绍模型推理的输出过程方案原始Token输出RM输出(回归任务) 介绍 奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练&#xff0c…

这里写自定义目录标题

  • 介绍
  • 模型推理的输出过程方案
    • 原始Token输出
    • RM输出(回归任务)

介绍

奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练,但是没有讲解RM是如何输出一个分数的。本文只讲RM的输出,以补充资料的缺乏。RM通常采用Llama-7B模型,本文也沿用这一模型,同时模型的推理计算过程作为已知的知识,只讲解推理最后的输出部分。本文章先介绍传统Llama模型原始Token输出过程,再讲解RM的输出。以作为对比更好的学习。

模型推理的输出过程方案

  1. 原始Token输出

预训练语言模型(如LLaMA、GPT等)的默认任务是语言建模,它们的输出是针对每个token的概率分布(即词汇表中的每个词的概率)
在这里插入图片描述在这里插入图片描述
注,W矩阵在llama-7b中是lm_head.weight

  1. RM输出(回归任务)

写在前面:回归任务就不需要原始Token输出中的logits矩阵的计算(即图中H*W+B的部分)和softmax的计算。

  • 处理每个token的隐藏状态以生成全局表示
    隐藏状态的介绍:
    在这里插入图片描述
    1) 平均池化(Mean Pooling)
    在这里插入图片描述
    2) 最大池化(Max Pooling)在这里插入图片描述
  • 回归任务输出分数:

在这里插入图片描述

http://www.yayakq.cn/news/151935/

相关文章:

  • 网站建设哪家强wordpress是建站最快的
  • 自动跳转手机网站代码建筑工程公司起名大全
  • 网页导航视频网站在线制作教程山东城市建设厅网站
  • 新乡做网站价格ps做网页怎么在网站上打开
  • 网站推广做多大尺寸设计logo的网址
  • 国外专业做集装箱别墅网站上海建设银行公司网站
  • 注册网站免费注册qq邮箱在哪个网站上做预收款报告
  • 佛山外贸网站建设流程网络营销作业
  • 子洲网站建设制作百度小说风云榜排行榜官网
  • 外贸网站 海外推广大连市工程建设信息网
  • 平台网站开发沈阳妇科医院排名最好的医院
  • 制作网站站用的软件沧州网站建设报价
  • 河北省建设银行网站首页营销方案案例范文
  • 做相册哪个网站好用网上怎么自己注销营业执照
  • 理财网站开发页面简洁的导航网站
  • 如何做网站旅游产品分析江阴网站制作设计
  • 网站建设 套餐全国建筑行业资质平台查询官网
  • 做淘宝货源网站免注册制作网站
  • 湘潭网站建设工作室南京做网站的额
  • 汕头网站网店建设重庆市招标网官网
  • 增加网站访问量网站建设需要哪些的ps
  • 建筑设计作品展示网站如何自建网站卖产品
  • 网站建设行业税率王战胜局长
  • 网站怎样建立数据库连接做网站要多少钱 知乎
  • 北京高端网站网站建设 工作职责
  • 杭州定制网站免费建站还用学做网站吗
  • 2024年最新一轮阳性症状白杨seo教程
  • 高端网站建设代码做视频播放网站
  • 重庆企业网站建站新洲建设局网站
  • 沙田镇网站建设八爪鱼网站建设