当前位置: 首页 > news >正文

网站优化的主要任务巩义网站建设工程

网站优化的主要任务,巩义网站建设工程,广州越秀区网站建设,wordpress添加多首音乐ChatGLM3-6B 是一个语言大模型,最近在评估这个模型,但发现它的文档有限,只能从demo代码中猜测调用的参数的含义,准确度是有限的;于是,通过查看源代码来研究,目前整理笔记如下: Chat…

ChatGLM3-6B 是一个语言大模型,最近在评估这个模型,但发现它的文档有限,只能从demo代码中猜测调用的参数的含义,准确度是有限的;于是,通过查看源代码来研究,目前整理笔记如下:

ChatGLM3-6B 的调用接口有两个,一个是chat接口,一个是stream_chat接口

接口函数的实现位于代码 chatglm3-6b/blob/main/modeling_chatglm.py中

一、chat接口

chat接口的原型如下:

def chat(self, tokenizer, query: str, history: List[Dict] = None, role: str = "user",max_length: int = 8192, num_beams=1, do_sample=True, top_p=0.8, temperature=0.8, logits_processor=None,**kwargs):

参数说明如下:

参数名参数含义默认值
tokenizer用于处理输入和输出文本的tokenizer对象。由前面的 AutoTokenizer.from_pretrained 调用返回的对象
query str 类型,用户输入的任何文本
history List[Dict],可选参数;对话历史,每一项都是一个字典,包含角色('role')和内容('content')。None
role str, 可选参数;输入文本的角色,可以是'user'或者'assistant'。user
max_length int, 可选;生成文本的最大长度。8192
num_beamsint, 可选;Beam搜索的宽度,如果值大于1,则使用Beam搜索1
do_sample bool, 可选;是否从预测分布中进行采样,如果为True,则使用采样策略生成回复。True
top_p float, 可选;用于控制生成回复的多样性0.8
temperature float, 可选;控制生成文本的随机性的参数0.8
logits_processor LogitsProcessorList, 可选;用于处理和修改生成步骤中的logits的对象None
**kwargs其他传递给模型生成函数的参数

返回值:

response (str): 模型的响应文本。
history (List[Dict]): 更新后的对话历史。

二、stream_chat 接口

流式聊天函数,接受一段文本查询,返回模型的响应。这个函数返回的是一个生成器,可以在流式处理中使用。 

该接口函数的原型定义如下:

def stream_chat(self, tokenizer, query: str, history: List[Dict] = None, role: str = "user",past_key_values=None,max_length: int = 8192, do_sample=True, top_p=0.8, temperature=0.8,logits_processor=None, return_past_key_values=False, **kwargs):

参数说明如下:

 参数名参数含义默认值
tokenizer用于处理输入和输出文本的tokenizer对象。由前面的 AutoTokenizer.from_pretrained 调用返回的对象
querystr,必须参数;用户输入的任何聊天文本。
historyList[Dict], 可选;对话历史,每一项都是一个字典,包含角色('role')和内容('content')。None
rolestr, 可选: 输入文本的角色,可以是'user'或者'assistant'。user
past_key_valuesList[Tensor], 可选;用于transformer模型的过去的键值对None
max_lengthint, 可选: 生成文本的最大长度.8192
do_samplebool, 可选;是否从预测分布中进行采样True
top_pfloat, 可选: 用于控制生成回复的多样性。0.8
temperaturefloat, 可选;控制生成文本的随机性的参数0.8
logits_processorLogitsProcessorList, 可选;用于处理和修改生成步骤中的logits的对象。None
return_past_key_valuesbool, 可选): 是否返回过去的键值对,用于下一步的生成。False
**kwargs其他传递给模型生成函数的参数。

返回值:

response (str): 模型的响应文本。
history (List[Dict]): 更新后的对话历史。
past_key_values (List[Tensor], 可选): 如果return_past_key_values为True,返回用于下一步生成的过去的键值对。

http://www.yayakq.cn/news/498779/

相关文章:

  • 湖南建设人力资源湖南网站建设wordpress设为中文
  • 深圳市建设厅官方网站打造网站品牌
  • asp.net网站怎么做彭州做网站的公司
  • 郓城网站建设电话网站建设课程简介图片
  • 面试网站开发员wordpress 上传主机
  • 山东高端网站建设徐州建设集团有限公司
  • 做网站的原理seo长沙
  • 在哪可以接企业网站建设的活在广州学编程有名气的培训班
  • 网站降权处理彩票网站开发 合法
  • 哪些网站可以接生意做社团建设制作网站费用会计科目
  • 360网站怎么做ppttheme one wordpress
  • 做360手机网站快速排做gif的网站
  • 电子商务网站开发实训总结建一个大网站需要的时间
  • 资源网站优化排名网站文字转视频软件app
  • 集团网站定制西宁网站建设报价cu君博规范
  • 商城网站建设预算要多少钱做网站的快捷方式代码
  • 网站建设分金手指排名二五正规外贸流程
  • 怎么做类似豆瓣的网站wordpress主题apok
  • 成都科盛兴网站建设有限公司站群是什么意思
  • 长春市科学技术局网站9377传奇
  • 白沙网站建设网站代
  • 擦边球网站怎么建设统计网站的代码
  • 网络购物网站备案西安seo顾问 顺时网络
  • 太原规划网站wordpress 附件清理
  • 做视频网站视频用什么插件吗网站开发策划书怎么写
  • 最好设计网站建设长乐市住房和城乡建设局网站
  • 普象工业设计网站手机编程app
  • seo教程技术手机网站seo优化
  • 网站运营经理wordpress 惠喵
  • 网站的图文链接怎么做的网站设计流程大致分为几个阶段