当前位置: 首页 > news >正文

郑州建设厅网站百万网站建设报价

郑州建设厅网站,百万网站建设报价,怎么让百度收录自己的网站,建设网站文案标识语文章目录 前言一、大语言模型loss计算1、loss计算代码解读2、构建模型输入内容与label标签3、input_ids与labels格式 二、多模态大模型loss计算方法1、多模态loss计算代码解读2、多模态输入内容2、大语言模型输入内容3、图像embending如何嵌入文本embeding 前言 如果看了我前面…

文章目录

  • 前言
  • 一、大语言模型loss计算
    • 1、loss计算代码解读
    • 2、构建模型输入内容与label标签
    • 3、input_ids与labels格式
  • 二、多模态大模型loss计算方法
    • 1、多模态loss计算代码解读
    • 2、多模态输入内容
    • 2、大语言模型输入内容
    • 3、图像embending如何嵌入文本embeding

前言

如果看了我前面文章,想必你基本对整个代码有了更深认识。实际上,大多大模型都是使用huggingface搭建,而大多LORA训练也是调用PEFT库。然而,LLaVA代码却没有相关VIT模型训练内容,也没有不同组合训练。而我也是想探索单独使用vit的lora训练、单独使用llm的lora训练或全都使用会有什么效果呢?因此,本篇文章将探索LLaVA如何按需构建LORA训练,我会给出如何构建参数与修改源码,也会给出我实验结果。实验结果表明,视觉、语言、映射三着结合训练基本没有效果,视觉与语言训练也不会有效果,而其它基本会有转好效果。

一、大语言模型loss计算

1、loss计算代码解读

我以llama3的loss计算方法来说明,大语言模型的loss计算逻辑,我们可以发现输出logits是取前n-1个位置内容,而lables是取了1:n的内容。如此,使用计算前面内容推理后面内容,假如你输出是5个可推理第6个token内容,如此类推就可以生成式的给出推理内容,这也是推理逐字生成方法,其代码如下图:

在这里插入图片描述
我们从代码中可已发现,大语言模型使用交叉熵来计算的,至于有关交叉熵相关原理,可自行参考其它博客内容。

2、构建模型输入内容与label标签

我给出大概loss计算标签,我们可以发现input_ids输入与labels是对应的,只是和我上面所说训练是错位计算交叉熵。我也整理了一份表格供读者参考。当然,我这里有问题可留言指正。

在这里插入图片描述

3、input_ids与labels格式

这里我以语言模型为例,huggingface训练输入input_ids与labels对应的id是一样的,只是再计算loss时候,模型输出减少了最后一位,而labesl去掉开始一个位置,以此达到了错位计算loss的目的,具体可查看如下图示。

在这里插入图片描述

二、多模态大模型loss计算方法

1、多模态loss计算代码解读

多模态大模型都是依附大语言模型来获得输出内容。尽然如此,多模态大模型的loss计算方法和我上上面说的llama3的loss计算方法一致,都是使用交叉熵方法来求解loss,也是输出logits是取前n-1个位置内容,而lables是取了1:n的内容。如此,使用计算前面内容推理后面内容,假如你输出是5个可推理第6个token内容,如此类推就可以生成式的给出推理内容,这也是推理逐字生成方法,其代码如下图:
在这里插入图片描述
这里重点强调:-100位置不需要计算loss,我非常肯定!!

2、多模态输入内容

当然,多模态和大语言模型还是有区别,主要在于多了其它编码模块,如图像多模态就是多了图像编码器将输出内容作为大语言输入ids。再进入大语言模型输入之前模型的输入内容如下图:
在这里插入图片描述
从图上可知,有了图像占位内容,而labels不需要计算loss为-100.

2、大语言模型输入内容

我再之前以说过,多模态大模型是依附大语言模型输入。自然输入大语言模型内容格式需和大语言模型一样,然而图像需要经过图像编码encoder模块将图像转为embedding,在与文本进行cat,我这下面是个大致的示意表格,如下:
在这里插入图片描述

3、图像embending如何嵌入文本embeding

这里,我借助b站的up所说,可参考下图内容。b站参考连接这里
拼接位置:
在这里插入图片描述

拼接embeding:
在这里插入图片描述
注:embedding的拼接!

http://www.yayakq.cn/news/805992/

相关文章:

  • 西安网站建设培训学校网站建设 维护 服务描述
  • 常州网站设计平台企业信息公示系统全国官网
  • 泉州模板自助建站求一个做健身餐的网站
  • 手机软件下载网站山东一建建设有限公司官方网站
  • 怎么做网站切图河南省住房和建设厅安监站网站
  • 泰安网站建设广告网站底部悬浮广告代码
  • 地产金融网站开发wordpress版本选择
  • 开发公司对物业公司的补贴怎么开票wordpress怎样优化3
  • 企业级网站内容管理解决方案seo竞价培训
  • 网站需求报告怎么写网站跟换域名
  • 搜索引擎提交网站wordpress图像验证码
  • 网站排名分析 用户需求升腾d9116 做网站
  • 乐陵森洁新能源有限公司电话seoul是什么国家
  • 企业网站推广方式和策略wordpress 导航标签
  • 苏州招聘网站开发婚纱网站怎么做seo
  • 中国最厉害的互联网公司怎样做网站优化 知乎
  • 三 加强门户网站等新媒体建设网站集群 建设方案
  • 请人做竞价网站的要求重点网络运营主要做什么
  • 淮安网站定制.net网站开发环境
  • 工具类网站设计百度site app网站添加到网站首页源文件中的代码是哪些?
  • 新余教育网站建设建设部官网网站
  • 旅游网站开发设计如何创建自媒体手机网站
  • 建设网站用什么好烟台seo快速排名
  • 宁波搭建网站公模仿淘宝详情页做网站
  • 网站维护怎么学学院二级网站建设方案模板
  • 做网站傻瓜做网站电话号码
  • 网站开发小组分工不需要备案如何做网站
  • 北京网站排名方案九江县建设规划局网站
  • 如何免费做网站并发布网站建设论团
  • 如何做融资网站网站制作熊猫建站