当前位置: 首页 > news >正文

网站优化注意事项注册公司网站怎么做

网站优化注意事项,注册公司网站怎么做,好搜搜索引擎,利用网站做蜘蛛池基于已有的图像模型和文本模型构建多模态模型。输入是图像、视频和文本,输出是文本。 Vision encoder来自预训练的NormalizerFree ResNet (NFNet),之后经过图文对比损失学习。图片经过图像模型的输出是2D grid,视频按1FPS的频率采样后经过图…

基于已有的图像模型和文本模型构建多模态模型。输入是图像、视频和文本,输出是文本。

Vision encoder来自预训练的NormalizerFree ResNet (NFNet),之后经过图文对比损失学习。图片经过图像模型的输出是2D grid,视频按1FPS的频率采样后经过图像模型的输出是3D grid,都展开成1D送入Perceiver Resampler。

Perceiver Resampler将变长的图片或者视频的特征变成固定长度。结构如下图:

通过gated cross-attention dense模块结合图像特征和文本特征。gated cross-attention dense模块使用了tanh-gating机制,用tanh(a)乘以文本和图像模态cross-attention后的输出,a初始化为0。tanh-gating机制保证初始化的时候,模型不受图像特征的影响,输出就是语言模型的输出。

使用single-image cross-attention方法,在计算图像和文本的cross-attention时,通过mask,让文本token只能看到前面的一幅图像的token。

 

训练数据数据集包括公开数据和自建数据。M3W(43 million webpages)、ALIGN dataset(1.8 billion images with alt-text 43 million webpages)、312 million image and text pairs、27 million short videos and text pairs。

http://www.yayakq.cn/news/415930/

相关文章:

  • 网站模板 html大淘客做网站视频
  • 佛山市国外网站建设公司做文字头像的网站
  • 网址站长之家瑞诺国际做外贸网站好吗
  • 找外包公司做个网站多少钱企业管理咨询案例分析
  • 河北网站建设与管理企业采购平台有哪几个知名
  • 东莞市公司网站建设服务机构链接买卖价格
  • 家居企业网站建设讯息厚街手机网站建设
  • 射阳做网站公司百度软件应用中心
  • 站长统计黄页网站下载大全机械技术支持东莞网站建设
  • 建网站相关知识代帮企业做网站
  • 网站建设运营合同范本网站被k表现
  • 宁波网站建站的公司网站加载很慢
  • 河北网站优化企业模板建站公司
  • 生物网站 template新网站做seo
  • 建筑工程公司网站模板下载微信开放平台的发展前景
  • 如何做电影下载网站网站推广服务怎么做
  • 网站开发和网站维护有区别吗沈阳哪家网站制作公司比较好
  • 汽车租赁网站开发课程网站如何建设方案
  • 专业做财务公司网站微信小程序模板网站
  • 百度网站 收录柳州建设厅官方网站
  • 深圳网站建设公司乐云seo沈阳哪个公司可以做网站
  • 如何自己做网站并开发软件做sgs认证的公司网站
  • 网站的外链建设计划合肥那个公司做网站优化好
  • 室内设计联盟官方网站图片杭州网站开发工程师
  • 正规网站优化哪个公司好制作网站视频
  • 制作线下交易平台网站建设一级消防工程师考试大纲
  • 东莞英文建站网站页面吸引力
  • 创建网站能赚钱吗中国免费网站服务器免费下载
  • 关于建筑设计的网站石嘴山网站seo
  • 做播放器电影网站需要多少钱6无锡论坛网站制作