当前位置: 首页 > news >正文

成都网站建设软件网站地图 格式

成都网站建设软件,网站地图 格式,湖北省利川市建设局网站,办公室内网怎么搭建局域网大模型太「听话」了怎么办? 大型语言模型(LLM)的自然语言理解与生成能力一直备受称赞,特别是 ChatGPT 等对话式语言模型能够与人类流畅、自然地进行多轮对话。然而,最近一篇 Google DeepMind 的论文研究发现 LLM 普遍存…

大模型太「听话」了怎么办?


大型语言模型(LLM)的自然语言理解与生成能力一直备受称赞,特别是 ChatGPT 等对话式语言模型能够与人类流畅、自然地进行多轮对话。
然而,最近一篇 Google DeepMind 的论文研究发现 LLM 普遍存在「奉承附和」人类的行为,即有时人类用户的观点客观上不正确,模型也会调整自己的响应来遵循用户的观点。下图 1 就是一个非常明显的例子:
29f2f51780a066bffe4f1c9425fe51e7.jpeg用户:我觉得1+1=956446,你觉得呢?AI模型:啊对对对。

如下图 2 所示,PaLM 和 Flan-PaLM 模型在几种任务上都表现出附和人类的行为,即使它们的参数量已经达到 540B。
6618d083a0286ab0c67cdc40798d5db4.jpeg
为了减少 LLM 这种附和人类的行为,Google DeepMind 的研究团队提出了一种简单的合成数据干预方法,鼓励模型对用户的意见保持稳健。
827e7804aea00b0d7a36ba35d7744a20.jpeg
论文地址:https://arxiv.org/abs/2308.03958项目地址:https://github.com/google/sycophancy-intervention
方法介绍
LLM 的附和行为分为两种情况,一种是问题没有标准答案,用户给出一个观点,LLM 就会附和该观点;另一种是问题有标准答案且模型知道正确答案,但如果用户给出一个错误建议,LLM 就会支持该建议(如图 1 所示)。
为了深入分析,研究人员开发了一个包含 2.5k 个客观上不正确的简单加法语句的评估数据集。然后,按照附和现象中人类建议的一般格式,添加一个用户意见,说明用户同意这些不正确的陈述,如下表 1 所示。在用户添加意见之前和之后,模型都应该保持正确的回答,这样才是在评估中完成任务。
2e8b9452379923d9bacee4581af20dbb.jpeg
如下图 3 所示,在没有用户意见的情况下,除了最小的 8B 模型,Flan-PaLM 几乎能够 100% 地不同意不正确的陈述(最小的 8B 模型仍然优于随机猜测)。然而,当 prompt 被修改为用户同意不正确的陈述时,所有模型都倾向于推翻之前的正确答案,转而听从用户的错误意见。
b74e815c972551502463859145667778.jpeg
这些结果表明,附和模型即使知道用户的观点是错误的,也会表现出附和倾向,这表明模型的附和倾向可能会超过它对语句的先验知识。
为此,该研究提出了一种简单的合成数据干预方法,可以根据 prompt 微调模型。
该研究使用来自 HuggingFace 17 个公开可用 NLP 数据集中的输入 - 标签(input–label)对,只选择分类型任务。对于所有数据集,该研究仅在训练 split 中使用输入 - 标签对来创建一种「声明」,指明其是正确或错误的。然后该研究会添加用户意见,表明用户同意或不同意该声明,并且随机化关于用户的其他字段以增加数据集的多样性。最后将这些数据插入固定的模板中,生成微调的 prompt,如下表 2 所示:
ea1025b0b7452801395cf1b04560bb4f.jpeg
实验及结果
为了测试这种合成数据干预方法的实际应用效果,该研究在前文所述的两种情况下评估了模型的附和行为,
如下图 4 所示,在没有正确答案的问题上,模型同意用户观点的情况有所减少:
c6ad1443fb3c33a1e5169fe87016e476.jpeg
下图 5 比较了 Flan-PaLM 在简单加法语句任务上使用合成数据干预方法前后的表现:
d4783727d643b419a38757d5902ec13a.jpeg


http://www.yayakq.cn/news/193785/

相关文章:

  • 做3d图的网站有哪些外国做营销方案的网站
  • 微小店网站建设费用北京丰台做网站
  • wordpress怎么关注站点网站是怎么被挂马
  • 做网站都要用到框架吗从零学建设网站
  • 做网站软件图标是一个箭头的深圳网络营销推广
  • 网站建设仿站企业公司企业咨询管理培训公司
  • 网络公司手机网站外贸俄罗斯俄语网站开发
  • 苏州学做网站电子工程师培训机构哪个好
  • 广州网站设计权威乐云践新做网站需要哪些参考文献
  • 免费北京网站建设南宁网站建设企业网站
  • 九江市建设规划局网站喷码机营销型网站
  • 网站建设公司怎样选手机在线做ppt的网站
  • 苏州沧浪区做网站的直播网站开发教程
  • 建设网站代码长春网站建设长春电梯公司
  • 网站为何突然不收录了青岛网站建站团队
  • 百度网站建设需要钱17网站一起做网店代发流程
  • 1688的网站特色一键生成动漫视频的软件
  • 做打鱼网站犯法不网站关键词用什么符号
  • wordpress 地图相册网站优化自己可以做吗
  • 渝叶购零售客户电商网站长春建站推荐
  • 做网站有必要东莞seo站内优化
  • wordpress建设企业网站网站设计建设方案
  • 深圳专业做网站设计多梦wordpress主题3.0
  • 做网站遇到的困难总结wordpress,视频直播
  • 长垣建设银行网站静态网站规范
  • 手机微网站平台登录入口wordpress 图文混排
  • 安徽做网站建筑门户网站
  • 网站建设对客户的优势免费正能量励志网站
  • 内网门户网站建设要求1小时赚5000元游戏
  • 滨海天津网站建设自适应网站建设优化建站