当前位置: 首页 > news >正文

嘉兴建设企业网站电商平台推广公司

嘉兴建设企业网站,电商平台推广公司,做电子商务系统网站,简单的手机网站模板在NVIDIA Jetson平台离线部署大模型,开启离线具身智能新纪元。 本项目提供一种将LMDeploy移植到NVIDIA Jetson系列边缘计算卡的方法,并在Jetson计算卡上运行InternLM系列大模型,为离线具身智能提供可能。 最新新闻🎉 [2024/3/1…

在NVIDIA Jetson平台离线部署大模型,开启离线具身智能新纪元。

本项目提供一种将LMDeploy移植到NVIDIA Jetson系列边缘计算卡的方法,并在Jetson计算卡上运行InternLM系列大模型,为离线具身智能提供可能。

最新新闻🎉

  • [2024/3/15] 更新了对LMDeploy-v0.2.5。
  • [2024/2/26] 本项目被LMDeploy官方社区收录。

已验证模型/平台

  • ✅:已验证可运行
  • ❌:已验证不可运行
  • ⭕️:待验证
ModelsInternLM-7BInternLM-20BInternLM2-1.8BInternLM2-7BInternLM2-20B
Orin AGX(32G)
Jetpack 5.1

Mem:??/??
14.68 token/s

Mem:??/??
5.82 token/s

Mem:??/??
56.57 token/s

Mem:??/??
14.56 token/s

Mem:??/??
6.16 token/s
Orin NX(16G)
Jetpack 5.1

Mem:8.6G/16G
7.39 token/s

Mem:14.7G/16G
3.08 token/s

Mem:5.6G/16G
22.96 token/s

Mem:9.2G/16G
7.48 token/s

Mem:14.8G/16G
3.19 token/s
Xavier NX(8G)
Jetpack 5.1

Mem:4.35G/8G
28.36 token/s

未来工作

  • 更新更多型号Jetson板卡的Benchmark测试数据
  • 制作Jetson专用whl发行版
  • 跟进更新版本的LMDeploy

部署教程

Jetson端离线运行InternLM大模型

创建模型保存目录:

mkdir -p ~/models

将S1.服务器端模型W4A16量化得到的internlm-chat-7b-turbomind.tgz上传到models目录下。

解压模型文件:

tar zxvf internlm-chat-7b-turbomind.tgz -C .

0.Bug解决:修改MMEngine库

Jetson端的pytorch不支持分布式的reduce算子,这会导致MMEngine库中与分布式有关的部分出现错误。

错误为:

AttributeError: module 'torch.distributed' has no attribute 'ReduceOp'

激活conda环境:

conda activate lmdeploy

用解释器方式运行python:

python

输入如下内容:

import mmengine
print(mmengine.__file__)

这就输出了MMEngine库的安装位置,笔者的是/home/nvidia/miniconda3/envs/lmdeploy/lib/python3.8/site-packages/mmengine/__init__.py,那么相应位置就是home/nvidia/miniconda3/envs/lmdeploy/lib/python3.8/site-packages/mmengine/,咱们用<path/to/mmengine>代替。

修改<path/to/mmengine>/logging/logger.py第208行:

- global_rank = _get_rank()
+ global_rank = 0

在运行就不会报错了。

注意:该方式过于粗暴,仅适用于Jetson平台部署推理,在服务器端会影响分布式功能!

1.终端运行

激活conda环境:

conda activate lmdeploy

运行模型:

lmdeploy chat turbomind ./internlm-chat-7b-turbomind

在这里插入图片描述

2.Python集成运行

编写运行脚本run_model.py,内容如下:

from lmdeploy import turbomind as tmif __name__ == "__main__":model_path = "./internlm-chat-7b-turbomind" # 修改成你的路径tm_model = tm.TurboMind.from_pretrained(model_path)generator = tm_model.create_instance()while True:inp = input("[User] >>> ")if inp == "exit":breakprompt = tm_model.model.get_prompt(inp)input_ids = tm_model.tokenizer.encode(prompt)for outputs in generator.stream_infer(session_id=0, input_ids=[input_ids]):res = outputs[1]response = tm_model.tokenizer.decode(res)print("[Bot] <<< {}".format(response))

激活conda环境:

conda activate lmdeploy

运行脚本:

python run_model.py

在这里插入图片描述

附录

  • 为Jetson重装Jetpack
  • LMDeploy-Jetson基准测试

引用

如果本项目对您的工作有所帮助,请使用以下格式引用:

@misc{2024lmdeployjetson,title={LMDeploy-Jetson:Opening a new era of Offline Embodied Intelligence},author={LMDeploy-Jetson Community},url={https://github.com/BestAnHongjun/LMDeploy-Jetson},year={2024}
}

致谢

  • 书生·浦语大模型实战营
  • 上海人工智能实验室
  • trt-llm
http://www.yayakq.cn/news/780153/

相关文章:

  • 电商平台网站 建设目标软件开发模型图
  • 六安门户网站建设哪家好拥有域名后怎么建设网站
  • 上海做壁画的网站织梦网站安装视频教程
  • 管理网站建设源代码程序相亲网站绑定微信怎么做
  • 内蒙古网站备案西安网站建设兼职
  • 有什么网站是做投资的莱芜论坛莱芜在线
  • 福州网站建设找时时在网络网站开发源码
  • 网站模板 带后台天津网站建设制作方案
  • 棋牌网站开发多少钱北京优化网站
  • 云南建设厅网站备案厂家厦门的推广公司有哪些
  • 网站建设培训课程汽车网页制作素材
  • 网站怎么做登录模块仪征市建设工程网站
  • 移动网站开发流行wordpress制作下拉菜单
  • 专注网站开发广州做家教的网站
  • 京东网站建设怎么创办一个网站
  • 十大团购网站上海最新新闻热点事件
  • 深圳有哪些招聘网站互联网营销平台有哪些
  • 建设部网站村镇建设成品网站源码免费分享
  • 做ios试玩推广网站株洲发布最新通告
  • wordpress网站主题网站粘性
  • 网站制作培训机构中山网页模板建站
  • 成都市建设工程施工安监站网站dw软件教程
  • 手机wordpress教程深圳seo外包公司
  • 程序员是不是都是做网站的分类信息网站怎么做SEO
  • 技术支持:上海网站建设网站建设设计制作包头
  • 河南网站建设公司甘肃建设体网站首页
  • 国内企业网站欣赏邓卅做网站在什么地方
  • 网站备案免费的吗众筹网站功能
  • seo排名优化有哪些婚纱摄影 网站关键词 优化
  • 西安哪有建网站的吴江建网站