当前位置: 首页 > news >正文

注册公司查名字哪个网站做互助盘网站多少钱

注册公司查名字哪个网站,做互助盘网站多少钱,建设银行官网首页网站招聘,东光网站建设淘宝店铺装修本文是LLM系列文章,针对《robust distortion-free watermarks for language models》的翻译。 语言模的鲁棒无失真水印 摘要1 引言2 方法和理论分析3 实验结果4 讨论 摘要 我们提出了一种从自回归语言模型中在文本中植入水印的方法,该方法对扰动具有鲁…

本文是LLM系列文章,针对《robust distortion-free watermarks for language models》的翻译。

语言模的鲁棒无失真水印

  • 摘要
  • 1 引言
  • 2 方法和理论分析
  • 3 实验结果
  • 4 讨论

摘要

我们提出了一种从自回归语言模型中在文本中植入水印的方法,该方法对扰动具有鲁棒性,而不会在一定的最大生成预算下改变文本上的分布。我们通过将一系列随机数映射到语言模型的样本来生成带水印的文本,这些随机数是我们使用随机水印密钥计算的。为了检测带水印的文本,任何知道密钥的一方都可以将文本与随机数字序列对齐。我们用两种采样方案来实例化我们的水印方法:逆变换采样和指数最小采样。我们将这些水印应用于三种语言模型-OPT-1.3B、LLaMA-7B和Alpaca-7B,以通过实验验证它们的统计能力和对各种转述攻击的鲁棒性。值得注意的是,对于OPT-1.3B和LLaMA-7B模型,我们发现即使在通过随机编辑(即替换、插入或删除)损坏了40-50%的token之后,我们也可以从35个token中可靠地检测到带水印的文本(p≤0.01)。对于Alpaca-7B模型,我们对典型用户指令的水印响应的可行性进行了案例研究。由于响应的熵较低,检测更加困难:大约25%的响应(其中值长度约为100个token)在p≤0.01的情况下是可检测的,并且水印对我们实现的某些自动转述攻击的鲁棒性也较差。

1 引言

2 方法和理论分析

3 实验结果

4 讨论

在本文中,我们为语言模型提供了第一个对编辑和/或裁剪具有鲁棒性的无失真水印策略。支撑我们方法的关键思想是利用稳健序列比对的方法,将假定的带水印文本与LM提供商用于生成带水印文本的水印密钥序列进行比对。我们的水印的统计能力相对于文本的长度呈指数级提高,并且相对于水印密钥序列的长度仅线性减小。
我们的水印检测算法的计算复杂度在水印密钥序列的长度上是线性的,这也是LM提供者可以生成的无失真水印token的总数。相反,Christ等人以及Aaronson和Kirchenbauer等人的水印检测算法的复杂性在输入文本的长度上是线性的;然而,前一种水印不具有抗破坏性,后两种水印也不具有无失真性。这些渴望之间的这种明显的权衡是否是根本性的,这是一个有趣的悬而未决的问题。
包括我们的水印策略在内的所有上述水印策略背后的基本假设是LM提供者和水印检测器通过预先共享信息(例如水印密钥)来进行协调。事实上,水印的主要固有限制是检测器必须信任LM提供者在生成文本时忠实地应用水印。第二个限制不是固有的,但目前适用于所有已知的水印,即LM提供者不能发布模型权重,因为用户可以直接查询模型,而不是通过LM提供者。在不降低模型质量的情况下,将鲁棒水印直接植入语言模型的权重中是未来工作的重要方向。
最近,几家主要的语言模型提供商(包括OpenAI、Anthropic、谷歌和Meta)承诺从他们的模型中为文本添加水印。因此,我们最后向从业者提出了一些突出的建议。首先,我们建议从业者使用我们的EXP编辑水印,因为它是迄今为止我们测试过的水印中最健壮的。第二,尽管原则上水印密钥序列n的长度——它对LM提供者可以生成的无失真水印token的总数施加了上限——可以在测试统计的块大小k中(几乎)呈指数增长,同时仍然能够从k个token中检测水印,在实践中,我们发现使用相当小的水印密钥序列(例如,n=256)不会显著影响带水印文本的质量(即,即使在总共生成n个以上的token时)。我们的水印检测过程(即算法3中的检测和测试统计)很容易并行,因此我们预计,即使有非常大的水印密钥序列(例如,n=100000),水印检测的计算需求也不会成为显著的瓶颈–尽管我们注意到,我们从未在实现中运行过如此大的n(并且我们没有利用并行性),从而警告了这种猜测。

http://www.yayakq.cn/news/411404/

相关文章:

  • 为某网站做一则广告语建设网站毕业设计开题报告
  • 那种投票网站里面怎么做做落地页的网站
  • 中国站长之家域名查询个人网页设计与制作模板教程
  • 化妆网站模板南昌做网站排名
  • 做网站 赚钱吗制作网页最多的图片格式
  • 推广网站的方法帮平台做推广怎么赚钱
  • 手机怎做网站二次开发软件
  • 如何使用阿里云建站做京挑客的网站有哪些
  • 国外网站域名 中国哪个杭州seo好
  • 为什么我自己做的网站搜索不到个人简历网免费模板
  • 珠海市网站建设哪家好php网站开发试卷
  • 一个服务器下怎么做两个网站可以建网站的软件
  • php培训网站源码什么项目必须走辽宁建设工程信息网
  • 网站建设费如何做账网站建设与管理课程实训
  • 小说网站做编辑常见的网站空间有哪些
  • 做亚马逊学英语有什么网站吗制做网站首先应该怎么做
  • wordpress全站链接制定一个网站建设方案
  • 如何提高网站访问速度的文章国外网站建设费用
  • 物流公司官方网站视频内容seo
  • 网站怎么设置支付功能android网站开发
  • 谷歌网站收录提交入口wordpress文字环绕图片
  • 建设网站制作实训报告在线文字logo设计
  • php 网站提速越南国家建设部网站
  • 网站开发要学的代码创意产品
  • 医疗网站备案wordpress打造
  • 网站建设yu深圳市西特塔网站建设工作室
  • 建网站的程序免费重庆做网站建设团队
  • 做网站多少钱googlethe word 和 wordpress
  • 如何查找网站根目录做百度推广网站找谁好
  • 设计网站公司长沙东莞长安网站建设