当前位置: 首页 > news >正文

深圳工业设计有限公司太原seo优化公司

深圳工业设计有限公司,太原seo优化公司,wordpress 顶部空白,山东莱芜最新新闻本文是LLM系列文章,针对《Adapting Language Models to Compress Contexts》的翻译。 使语言模型适应上下文压缩 摘要1 引言2 相关工作3 方法4 实验5 上下文学习6 压缩检索语料库实现高效推理7 结论不足 摘要 1 引言 2 相关工作 3 方法 4 实验 5 上下文学习 …

本文是LLM系列文章,针对《Adapting Language Models to Compress Contexts》的翻译。

使语言模型适应上下文压缩

  • 摘要
  • 1 引言
  • 2 相关工作
  • 3 方法
  • 4 实验
  • 5 上下文学习
  • 6 压缩检索语料库实现高效推理
  • 7 结论
  • 不足

摘要

1 引言

2 相关工作

3 方法

4 实验

5 上下文学习

6 压缩检索语料库实现高效推理

7 结论

我们引入了一种训练策略,用于将预训练的LMs调整为自动压缩器,自动压缩器将上下文递归压缩为摘要向量。我们的实验表明,摘要向量保留了重要的上下文信息,用于改进语言建模、上下文演示中的编码以及评估文章与用户查询的相关性。这表明,我们的无监督训练策略可以带来多用途的应用。摘要矢量可以预先计算、缓存和重复使用。这承诺通过减小注意力窗口的大小来提高实际的效率。未来还有大量工作要做,将自动压缩器扩展到更大的模型,并提高摘要向量的质量,以进一步缩小差距,同时充分关注长期上下文。

不足

  • 我们只将AutoCompressors应用于参数高达2.7B的OPT型号。未来的工作需要确定自动压缩器在大型模型中的表现,但随着摘要向量维度的增长,每个向量可以保留更多信息。我们还质疑,其他具有不同体系结构特征的预训练模型族,如未绑定的输入输出嵌入,是否更难适应自动压缩器。
  • 我们的研究结果表明,摘要向量忽略了一些通过充分关注可以获得的有用信息。此外,模型并不总是从增加汇总向量的数量中受益。我们怀疑,用于有效学习摘要向量的训练信号可能会受到预训练模型的限制,该模型非常善于根据当前片段中的纯文本标记进行预测。未来的工作需要改进这种优化。
  • 摘要积累仍然会随着分段数量的增加而导致二次复杂度,尽管其速率远低于完全注意力。未来的工作可能会探索更有效地组合许多摘要向量的方法。
http://www.yayakq.cn/news/397076/

相关文章:

  • 哈密网站制作小型企业网站建设报告
  • 响应式网站模板 金融网站建设的毕业设计成果
  • 招聘信息网站开发背景传媒公司运营是干嘛的
  • 登录广东省建设监理协会网站首页网站后台排版布局
  • 余姚企业网站建设dw制作网站网页模板
  • 网站彩票做号东莞最近有什么新闻
  • 常熟市建设局网站优秀创意广告设计赏析
  • 问卷调查网站赚钱中国工商银行官网网站
  • 免费网站模板宠物用品店苏州协会网站建设
  • 做网站 转行网站logoPS怎么做
  • wordpress邮件客户端深圳做网站优化工资多少
  • 可制作网页的软件seo百家外链网站
  • 微信用网站怎么做免费找工程项目承包软件
  • 做红酒知名网站wordpress 律师主题
  • 太原建站培训视频剪辑线下培训班
  • 旅游网站的导航栏目设计jquery 个人网站
  • 做网站成都哪家公司最好赤峰市网站建设
  • app和网站哪个有优势泉州推广优化公司
  • 破解版网站建设全国室内设计公司排行榜
  • 做装修网站北京网络科技公司
  • 哪些建材网站可以做宣传政务信息系统网站建设规范
  • 网站文章页图片不显示图片wordpress前台发布
  • 网站失败的原因wordpress图片主题中文版
  • 西双网站建设怎么注册网站啊
  • 如何查询网站历史快照网站建设和备案
  • 网站怎么企业备案wordpress 模板吧
  • 新网站不被收录的原因网站企业建设方案
  • 什么叫网站建设58同城建网站怎么做
  • 启明星网站建设关键词优化需要注意
  • 国家建设工程网官方网站2021最近最火的关键词