当前位置: 首页 > news >正文

找一家秦皇岛市做网站的公司鸿蒙开发语言

找一家秦皇岛市做网站的公司,鸿蒙开发语言,网络营销公司,廉洁四川官方网权威发布中国科学院自动化研究所与耶鲁大学计算机系研究人员联合发布了,一份名为《思维传播:用大型语言模型进行基于类比的复杂推理》的论文。 ChatGPT等大型语言模型展示出了超强的创造能力,只需简单的文本提示就能生成小说、营销创意、简历等各种文本内容。但…

中国科学院自动化研究所与耶鲁大学计算机系研究人员联合发布了,一份名为《思维传播:用大型语言模型进行基于类比的复杂推理》的论文。

ChatGPT等大型语言模型展示出了超强的创造能力,只需简单的文本提示就能生成小说、营销创意、简历等各种文本内容。但在处理复杂的推理任务时却差强人意,主要面临从0推理以及在任务推理过程中错误累加两大难题。

为了解决这些难题,研究人员提出了思维传播(Thought Propagation,简称“TP”)的技术框架,通过提出类比问题、解决类比问题、聚合类比问题,从而提升大语言模型的复杂推理能力。

根据在最短路径寻优、创造性写作和语言模型智能体计划测试结果显示,相比传统方法,思维传播将性能分别提升了12%、13%和15%。

简单来说,就是为大语言模型添加一种拟人化的“类比思想”,让其学会总结、利用过往的成功经验,不必总是从0开始。

论文地址:https://arxiv.org/abs/2310.03965
在这里插入图片描述

思维传播框架简单介绍

从论文内容来看,思维传播框架模拟的就是人类的“类比思想”。当我们遇见新问题时,经常会使用过往的经验、行动来解决这些难题,这也被称为“类比推理”。

思维传播框架主要由LLM Propose、LLM Solve、LLM Aggregate、多层实现和即插即用等多个模块组成。

LLM Propose :通过使用 prompt 的方式让语言模型提出与输入问题相关的类比问题。提出的类比问题可以从两个角度帮助解决输入问题:(1)类比问题的解可以直接转移应用到输入问题上;(2)解决类比问题可以推导出针对输入问题的计划。

在这里插入图片描述

LLM Solve:使用现有的提示方法(如 Chain-of-Thought)来解决输入问题和 LLM Propose 模块提出的类比问题。得到输入问题和类比问题的初始解。

LLM Aggregate:该模块聚合类比问题的解来增强输入问题。具体来说,有两种方式: (1)提示语言模型基于类比问题的结果直接产生输入问题的新解。

(2)比较输入问题和类比问题,并基于类比问题的结果推导针对输入问题的计划。然后执行该计划来纠正输入问题的中间推理。

多层实现:可以堆叠多个思维传播层,以利用 K 跳的类比问题来逐层改进输入问题的解。

在这里插入图片描述

即插即用:思维传播兼容现有方法,可以应用到不同的推理任务中,只需要替换 LLM Solve 模块的具体实现。

思维传播框架性能测试

为验证思维传播框架的性能,研究团队在最短路径寻优、创造性写作和语言模型智能体计划三大任务上进行了比较实验。

结果显示,思维传播相比于仅使用提示方法的基线系统,在找到最优解的性能提升12%,在生成连贯段落的性能提升13%,在完成任务的性能提升15%。

在这里插入图片描述

研究人员指出,这三个任务分别需要搜索图结构数据、开放式写作和长时间计划,当前的提示方法仍面临挑战。

而思维传播框架展现了在这些复杂推理任务上取得显著提升的潜力。同时,该框架提供了一种可即插即用的通用类比推理方法,可避免针对特定任务设计定制提示,降低使用门槛。

思维传播框架对大语言模型的重要性

从思维传播框架在GPT-4、GPT-3.5等大语言模型的测试结果来看,可显著提升复杂推理能力,并减少推理的错误。

提高复杂推理能力: 思维传播可以重用解决类比问题的经验,来增强大语言模型处理复杂任务的能力,例如,最短路径寻优、创造性写作等需要多步推理的任务。

减少推理错误:通过比较类比问题的解来指导输入问题的推理,可以帮助大语言模型避免从0开始推理时容易堆积的错误。

减少任务特定提示设计:提供了一个通用的类比推理框架,可以即插即用地应用到不同任务,减少了针对特定任务设计定制提示的工作量。

提供新的研究视角:思维传播为研究社区提供了,从类比推理视角来增强大模型复杂推理能力的新思路和有效途径。

表现优于同等规模模型:在多个任务上的试验表明,基于思维传播的GPT-4明显优于不使用该框架的GPT-4,以及其他同等计算量的模型。

可扩展性:思维传播是是一个通用框架,未来可继续优化和扩展到更多的复杂推理任务中,以发挥GPT-4等大语言模型的潜力。

在这里插入图片描述

总体来说,思维传播框架的优势在于可以重用类比问题的解来直接得到输入问题的新解,避免从0开始推理。

同时,它还可以学习到解决类比问题的总体策略,推导出计划来指导输入问题的推理,以此规避中间步骤的错误。

在这里插入图片描述

本文素材来源中国科学院自动化研究所论文,如有侵权请联系删除

http://www.yayakq.cn/news/990074/

相关文章:

  • 网站名是什么discuz做企业网站
  • 做招工的网站排名全国城乡和住房建设厅查询网
  • 网站 服务报价怎么增加网站首页权重
  • 华为模板建站网站上传权限问题
  • 织梦网站模板安装教程网站中留言板怎么做
  • 网站流量如何做制作企业网站的新闻显示
  • 沈阳网站页面设计公司青海网站建设的企业
  • 网站建设费用怎么算wordpress迁移后媒体库丢失
  • 网站编辑应该怎么做深圳龙岗发布通告
  • 重庆网站搭建方案wordpress点击图片直接相册浏览器
  • 怎么查看自己网站有没有被百度收录wordpress禁止访问后台
  • 建设银行网站背景图片北京市文化局政务网站建设项目
  • 北京网站建设app高要市建设局网站
  • 小城镇建设网站并阐述观点ps免费素材网站有哪些
  • 专业购物网站建设报价百度关键词优化软件怎么样
  • 网站改版了外贸网站模板外贸网站建设
  • 广州知名网站建设有哪些杭州百度开户
  • 伪类网站seo网站怎么搭建
  • 已备案网站更换域名grace8WordPress主题
  • 浙江荣盛建设集团网站学技术的培训学校
  • 镇江网站建设活动方案西部数据网站备案流程
  • 网站icp备案信息是什么意思企业年报查询
  • 教育类的网站案例软件开发工时费一般是多少
  • 大连网站建设选高合科技宁波高新区做网站的公司
  • 网站建设金手指排名稳定暖暖 免费 视频 在线观看1
  • 柳州市网站建设公司遵化手机网站设计
  • 网站域名收费标准天猫网站做的比京东好
  • 自助建站系统官方版龙岩抖音seo搜索排名
  • dede做漫画网站的案例通辽市北京网站建设
  • 网站开发很难么云服务器使用教程