当前位置: 首页 > news >正文

金华免费模板建站在厦门注册公司的流程

金华免费模板建站,在厦门注册公司的流程,提供零基础网站建设教学在哪里,优秀校园网站Large World Model(LWM)现在大火,其最主要特点是不仅能够针对文本进行检索交互,还能对图片、视频进行问答交互,自从上文《LWM(LargeWorldModel)大世界模型-可文字可图片可视频-多模态LargeWorld-详细安装记录》发出后&…

Large World Model(LWM)现在大火,其最主要特点是不仅能够针对文本进行检索交互,还能对图片、视频进行问答交互,自从上文《LWM(LargeWorldModel)大世界模型-可文字可图片可视频-多模态LargeWorld-详细安装记录》发出后,短短两天,github的Star已经涨到了5.4k!
在这里插入图片描述
上次安装之后,没有成功运行起来,今天终于把项目成功跑起来了。
首先体验的是视频问答功能,就是给LWM模型一段视频,然后就这段视频进行问答交互,首先看我给的视频:

beginning-spring

然后:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
看起来效果不错!

项目体验

运行方法:修改scripts/run_vision_chat.sh中对应的模型路径:

export llama_tokenizer_path=""
export vqgan_checkpoint=""
export lwm_checkpoint=""
export input_file=""

然后注意–mesh_dim='!1,-1,32,1’这个参数,按官方解释说:

You can use mesh_dim=dp, fsdp, tp, sp to control the degree of parallelism and RingAttention. It is a string of 4 integers separated
by commas, representing the number of data parallelism, fully sharded
data parallelism, tensor parallelism, and sequence parallelism. For
example, mesh_dim=‘1,64,4,1’ means 1 data parallelism, 64 fully
sharded data parallelism, 4 tensor parallelism, and 1 sequence
parallelism. mesh_dim=‘1,1,4,64’ means 1 data parallelism, 1 fully
sharded data parallelism, 4 tensor parallelism, and 64 sequence
parallelism for RingAttention.

但我这里无论怎么调都失败,索性删掉改参数,让程序使用默认配置。
下一个参数–dtype=‘fp32’ 修改为–dtype=‘fp16’ ,由于我的设备内存有限,改为fp16才能正常运行,修改后能正常运行的命令如下:

python3 -u -m lwm.vision_chat \--prompt="What is the video about?" \--input_file="$input_file" \--vqgan_checkpoint="$vqgan_checkpoint" \--dtype='fp16' \--load_llama_config='7b' \--max_n_frames=8 \--update_llama_config="dict(sample_mode='text',theta=50000000,max_sequence_length=131072,use_flash_attention=False,scan_attention=False,scan_query_chunk_size=128,scan_key_chunk_size=128,remat_attention='',scan_mlp=False,scan_mlp_chunk_size=2048,remat_mlp='',remat_block='',scan_layers=True)" \--load_checkpoint="params::$lwm_checkpoint" \--tokenizer.vocab_file="$llama_tokenizer_path" \

然后 bash run_vision_chat.sh即可查看效果。

多次问答

官方源码中的run_vision_chat.sh脚本只能执行一次脚本输入一个prompt,这样交互太累,我这里做了一点调整,实现多次循环问答交互:
在这里插入图片描述
修改代码如下:
首先复制一份lwm/vision_chat.py,重命名为vision_chat2.py,将其中的FLAGS参数对象修改为:

p={"prompt": "","input_file": "","vqgan_checkpoint": "","temperature": 0.2,"max_n_frames": 8,"seed": 1234,"mesh_dim": "1,-1,1,1","dtype": "fp32","load_llama_config": "","update_llama_config": "","load_checkpoint": "","tokenizer":VideoLLaMAConfig.get_tokenizer_config(),"llama":VideoLLaMAConfig.get_default_config(),"jax_distributed":JaxDistributedConfig.get_default_config()
}
FLAGS = types.SimpleNamespace(**p)FLAGS.vqgan_checkpoint = "模型vqgan路径"
FLAGS.dtype='fp16'
FLAGS.load_llama_config='7b'
FLAGS.max_n_frames=8
FLAGS.update_llama_config = "dict(sample_mode='text',theta=50000000,max_sequence_length=131072,use_flash_attention=False,scan_attention=False,scan_query_chunk_size=128,scan_key_chunk_size=128,remat_attention='',scan_mlp=False,scan_mlp_chunk_size=2048,remat_mlp='',remat_block='',scan_layers=True)"
FLAGS.load_checkpoint = "params::模型params路径"
FLAGS.tokenizer.vocab_file = "模型tokenizer.model路径"

对其中的main方法修改为:

if __name__ == "__main__":   FLAGS.input_file = input('vide path:')JaxDistributedConfig.initialize(FLAGS.jax_distributed)set_random_seed(FLAGS.seed)sampler = Sampler()while True:while FLAGS.prompt=='':FLAGS.prompt = input('input prompt:')prompts = [{'input_path': FLAGS.input_file, 'question': FLAGS.prompt}]output = sampler(prompts, FLAGS.max_n_frames)[0]print(f"Question: {FLAGS.prompt}\nAnswer: {output}")FLAGS.prompt=''

修改完成之后,仍然通过bash脚本来调用,新建一个bash脚本文件:

#! /bin/bash
python3 lwm/vision_chat2.py

祝大家玩得愉快!

http://www.yayakq.cn/news/177544/

相关文章:

  • 建自己的网站平面设计网页
  • 南京小程序开发网站建设系统优化的方法举例
  • 南宁 网站建设 制作页面设计标准规范
  • 广西南宁网站建设哪家好seo关键词排名实用软件
  • 建网站找兴田德润国内推广平台有哪些
  • 找别人做网站注意事项程序开发是什么工作
  • 装修公司网站用的织梦做一个购物商城网站多少钱
  • 社保官方网站登录入口企业网站建设需注意点
  • wordpress适合建什么网站吗公司ppt简介模板
  • 肇庆北滘网站设计网页设计师工资一般多少钱一个月
  • 网站空间租用协议工程预算培训
  • 网站空间的选择网站建设内容保障制度
  • 网站开发榜单规则济南网站开发公司排名
  • 网站编程培训学校招生金融网站开发的意义 论文
  • 制作相片的免费软件seo点击软件
  • 网站内容建设方法步骤建设一个一般网站需要多少时间
  • 山东住房建设厅官网站首页专业网站开发哪里找
  • 如何规划设计一个网站wordpress做多重筛选
  • 电子商务网站建设属性网站改版什么意思
  • 滕州网站建设滕州创建商务站点的主要工作
  • zeronet网站开发网站导航设计图片
  • 做论坛网站需要多大空间厦门协会网站建设
  • 新手做视频网站好学前端好找工作吗
  • 网站建设模板双人wordpress中搜索页面模板
  • 信息展示网站系统html5前端开发工程师
  • 手机建站哪家好威海精神文明建设办公室网站
  • 自己创建网站的注意事项17做网站官网
  • 小型网站建设步骤wordpress 漏洞利用
  • 湘潭做网站电话磐石网络网站建站工作室
  • 制作公司网站需要几个数据表html基本结构代码