当前位置: 首页 > news >正文

做自动发货网站台州关键词排名优化

做自动发货网站,台州关键词排名优化,网站手机优化显示,wordpress更换网站ChatGLM-6B ChatGLM-6B 一、介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型#xff0c;基于 General Language Model (GLM) 架构#xff0c;具有 62 亿参数。结合模型量化技术#xff0c;用户可以在消费级的显卡上进行本地部署#xff08;INT4 量化级别下最…ChatGLM-6B ChatGLM-6B 一、介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型基于 General Language Model (GLM) 架构具有 62 亿参数。结合模型量化技术用户可以在消费级的显卡上进行本地部署INT4 量化级别下最低只需 6GB 显存。 ChatGLM-6B 使用了和 ChatGPT 相似的技术针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练辅以监督微调、反馈自助、人类反馈强化学习等技术的加持62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答更多信息请参考我们的博客。此外为了方便下游开发者针对自己的应用场景定制模型我们同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南) INT4 量化级别下最低只需 7GB 显存即可启动微调。 不过由于 ChatGLM-6B 的规模较小目前已知其具有相当多的局限性如事实性/数学逻辑错误可能生成有害/有偏见内容较弱的上下文能力自我认知混乱以及对英文指示生成与中文指示完全矛盾的内容。请大家在使用前了解这些问题以免产生误解。更大的基于 1300 亿参数 GLM-130B 的 ChatGLM 正在内测开发中。 二、使用方式 硬件需求 量化等级最低 GPU 显存推理最低 GPU 显存高效参数微调FP16无量化13 GB14 GBINT88 GB9 GBINT46 GB7 GB 环境安装 使用 pip 安装依赖pip install -r requirements.txt其中 transformers 库版本推荐为 4.27.1但理论上不低于 4.23.1 即可。 代码调用 可以通过如下代码调用 ChatGLM-6B 模型来生成对话 python代码解读复制代码 from transformers import AutoTokenizer, AutoModeltokenizer AutoTokenizer.from_pretrained(THUDM/chatglm-6b, trust_remote_codeTrue)model AutoModel.from_pretrained(THUDM/chatglm-6b, trust_remote_codeTrue).half().cuda()model model.eval()response, history model.chat(tokenizer, 你好, history[])print(response) 你好!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。response, history model.chat(tokenizer, 晚上睡不着应该怎么办, historyhistory)print(response) 晚上睡不着可能会让你感到焦虑或不舒服,但以下是一些可以帮助你入睡的方法:1. 制定规律的睡眠时间表:保持规律的睡眠时间表可以帮助你建立健康的睡眠习惯,使你更容易入睡。尽量在每天的相同时间上床,并在同一时间起床。 2. 创造一个舒适的睡眠环境:确保睡眠环境舒适,安静,黑暗且温度适宜。可以使用舒适的床上用品,并保持房间通风。 3. 放松身心:在睡前做些放松的活动,例如泡个热水澡,听些轻柔的音乐,阅读一些有趣的书籍等,有助于缓解紧张和焦虑,使你更容易入睡。 4. 避免饮用含有咖啡因的饮料:咖啡因是一种刺激性物质,会影响你的睡眠质量。尽量避免在睡前饮用含有咖啡因的饮料,例如咖啡,茶和可乐。 5. 避免在床上做与睡眠无关的事情:在床上做些与睡眠无关的事情,例如看电影,玩游戏或工作等,可能会干扰你的睡眠。 6. 尝试呼吸技巧:深呼吸是一种放松技巧,可以帮助你缓解紧张和焦虑,使你更容易入睡。试着慢慢吸气,保持几秒钟,然后缓慢呼气。如果这些方法无法帮助你入睡,你可以考虑咨询医生或睡眠专家,寻求进一步的建议。完整的模型实现可以在 Hugging Face Hub 上查看。如果你从 Hugging Face Hub 上下载 checkpoint 的速度较慢也可以从这里手动下载。 Demo 我们提供了一个基于 Gradio 的网页版 Demo 和一个命令行 Demo。使用时首先需要下载本仓库 shell代码解读复制代码git clone https://github.com/THUDM/ChatGLM-6B cd ChatGLM-6B网页版 Demo 首先安装 Gradiopip install gradio然后运行仓库中的 web_demo.py shell代码解读 复制代码python web_demo.py程序会运行一个 Web Server并输出地址。在浏览器中打开输出的地址即可使用。最新版 Demo 实现了打字机效果速度体验大大提升。注意由于国内 Gradio 的网络访问较为缓慢启用 demo.queue().launch(shareTrue, inbrowserTrue) 时所有网络会经过 Gradio 服务器转发导致打字机体验大幅下降现在默认启动方式已经改为 shareFalse如有需要公网访问的需求可以重新修改为 shareTrue 启动。 感谢 AdamBear 实现了基于 Streamlit 的网页版 Demo运行方式见#117. 命令行 Demo 运行仓库中 cli_demo.py shell代码解读 复制代码python cli_demo.py程序会在命令行中进行交互式的对话在命令行中输入指示并回车即可生成回复输入 clear 可以清空对话历史输入 stop 终止程序。 API部署 首先需要安装额外的依赖 pip install fastapi uvicorn然后运行仓库中的 api.py shell代码解读 复制代码python api.py默认部署在本地的 8000 端口通过 POST 方法进行调用 shell代码解读复制代码curl -X POST http://127.0.0.1:8000 \-H Content-Type: application/json \-d {prompt: 你好, history: []}得到的返回值为 shell代码解读复制代码{response:你好我是人工智能助手 ChatGLM-6B很高兴见到你欢迎问我任何问题。,history:[[你好,你好我是人工智能助手 ChatGLM-6B很高兴见到你欢迎问我任何问题。]],status:200,time:2023-03-23 21:38:40 }低成本部署 模型量化 默认情况下模型以 FP16 精度加载运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限可以尝试以量化方式加载模型使用方法如下 python代码解读复制代码# 按需修改目前只支持 4/8 bit 量化 model AutoModel.from_pretrained(THUDM/chatglm-6b, trust_remote_codeTrue).half().quantize(4).cuda()进行 2 至 3 轮对话后8-bit 量化下 GPU 显存占用约为 10GB4-bit 量化下仅需 6GB 占用。随着对话轮数的增多对应消耗显存也随之增长由于采用了相对位置编码理论上 ChatGLM-6B 支持无限长的 context-length但总长度超过 2048训练长度后性能会逐渐下降。 模型量化会带来一定的性能损失经过测试ChatGLM-6B 在 4-bit 量化下仍然能够进行自然流畅的生成。使用 GPT-Q 等量化方案可以进一步压缩量化精度/提升相同量化精度下的模型性能欢迎大家提出对应的 Pull Request。 [2023/03/19] 量化过程需要在内存中首先加载 FP16 格式的模型消耗大概 13GB 的内存。如果你的内存不足的话可以直接加载量化后的模型仅需大概 5.2GB 的内存 python代码解读 复制代码model AutoModel.from_pretrained(THUDM/chatglm-6b-int4, trust_remote_codeTrue).half().cuda()[2023/03/24] 我们进一步提供了对Embedding量化后的模型模型参数仅占用4.3 GB显存 python代码解读 复制代码model AutoModel.from_pretrained(THUDM/chatglm-6b-int4-qe, trust_remote_codeTrue).half().cuda()CPU 部署 如果你没有 GPU 硬件的话也可以在 CPU 上进行推理但是推理速度会更慢。使用方法如下需要大概 32GB 内存 python代码解读 复制代码model AutoModel.from_pretrained(THUDM/chatglm-6b, trust_remote_codeTrue).float()[2023/03/19] 如果你的内存不足可以直接加载量化后的模型 python代码解读 复制代码model AutoModel.from_pretrained(THUDM/chatglm-6b-int4,trust_remote_codeTrue).float()如果遇到了报错 Could not find module nvcuda.dll 或者 RuntimeError: Unknown platform: darwin (MacOS) 的话请参考这个Issue. Mac 上的 GPU 加速 对于搭载了Apple Silicon的Mac以及MacBook可以使用 MPS 后端来在 GPU 上运行 ChatGLM-6B。首先需要参考 Apple 的 官方说明 安装 PyTorch-Nightly。然后将模型仓库 clone 到本地需要先安装Git LFS shell代码解读复制代码git lfs install git clone https://huggingface.co/THUDM/chatglm-6b将代码中的模型加载改为从本地加载并使用 mps 后端 python代码解读 复制代码model AutoModel.from_pretrained(your local path, trust_remote_codeTrue).half().to(mps)即可使用在 Mac 上使用 GPU 加速模型推理。 高效参数微调 基于 P-tuning v2 的高效参数微调。具体使用方法详见 ptuning/README.md。 ChatGLM-6B 示例 以下是一些使用 web_demo.py 得到的示例截图。更多 ChatGLM-6B 的可能等待你来探索发现 自我认知 提纲写作 文案写作 邮件写作助手 信息抽取 角色扮演 评论比较 旅游向导 局限性 由于 ChatGLM-6B 的小规模其能力仍然有许多局限性。以下是我们目前发现的一些问题 模型容量较小6B 的小容量决定了其相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时ChatGLM-6B 可能会生成不正确的信息它也不擅长逻辑类问题如数学、编程的解答。 点击查看例子 产生有害说明或有偏见的内容ChatGLM-6B 只是一个初步与人类意图对齐的语言模型可能会生成有害、有偏见的内容。内容可能具有冒犯性此处不展示 英文能力不足ChatGLM-6B 训练时使用的指示/回答大部分都是中文的仅有极小一部分英文内容。因此如果输入英文指示回复的质量远不如中文甚至与中文指示下的内容矛盾并且出现中英夹杂的情况。 易被误导对话能力较弱ChatGLM-6B 对话能力还比较弱而且 “自我认知” 存在问题并很容易被误导并产生错误的言论。例如当前版本的模型在被误导的情况下会在自我认知上发生偏差。 读者福利如果大家对大模型感兴趣这套大模型学习资料一定对你有用 对于0基础小白入门 如果你是零基础小白想快速入门大模型是可以考虑的。 一方面是学习时间相对较短学习内容更全面更集中。 二方面是可以根据这些资料规划好学习计划和方向。 资源分享 大模型AGI学习包 资料目录 成长路线图学习规划配套视频教程实战LLM人工智能比赛资料AI人工智能必读书单面试题合集 《人工智能\大模型入门学习大礼包》可以扫描下方二维码免费领取 1.成长路线图学习规划 要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。 对于从来没有接触过网络安全的同学我们帮你准备了详细的学习成长路线图学习规划。可以说是最科学最系统的学习路线大家跟着这个大的方向学习准没问题。 2.视频教程 很多朋友都不喜欢晦涩的文字我也为大家准备了视频教程其中一共有21个章节每个章节都是当前板块的精华浓缩。 3.LLM 大家最喜欢也是最关心的LLM大语言模型 《人工智能\大模型入门学习大礼包》可以扫描下方二维码免费领取
http://www.yayakq.cn/news/5539/

相关文章:

  • seo培训网的优点是seo推广任务小结
  • 医疗保健网站前置审批文件局域网建站软件
  • 网站建设目的功能wordpress 导航图片尺寸
  • 昌邑网站建设公司广州 环保 凡人网站建设
  • 程序员做网站美工能过关吗树莓派搭建wordpress
  • 开一个免费网站手机怎样做网站
  • 秦都区建设局网站音响网站模板免费下载
  • 网站汉英结合的怎么做竞价如何屏蔽恶意点击
  • 扫二维码做自己网站wordpress下单邮件通知的实现
  • 南昌建设厅网站网站首页背景图片
  • 重庆网站建设 渝网站开发程序介绍
  • h5是什么网站上面做的适合个人做外贸的网站
  • 做餐饮培训网站广告2345电脑版
  • 淘宝做基础销量怎么网站汕头seo不错
  • 建设进出口外贸网站最新国际热点新闻事件
  • 网站备案在线注销江苏省建设工程信息一体化平台
  • 深圳网站建设力荐上榜网络个体可以做企业网站吗
  • 黄冈网站建设哪家好手机网站模板 psd
  • 家里电脑做网站服务器网站建设首页需要哪些元素
  • 做网站现在什么最赚钱吗网站 免费空间
  • 湖北省建设工程人力资源网站建设网站需要做什么
  • 轻松建站wordpress gonzo
  • 快速收录网站内页自己做下载网站吗
  • 高大上网站wordpress 2.6
  • 安阳信息港网站wordpress 中文安装
  • 怎么做粉丝福利购网站品牌高端网站制作机构
  • 微信版网站制作个人网站建设课程
  • 鄂尔多斯市建设网站上海松江网站设计公司
  • 网站开发具体的工作内容上传网站内容
  • 云南外贸建站推广区块链做网站都有哪些内容呢