当前位置: 首页 > news >正文

做网页做网站的技术人才中国建设监理工程协会网站

做网页做网站的技术人才,中国建设监理工程协会网站,discuz整合wordpress,友情链接交换平台引言 这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。 传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。 这篇论文提出了Glancing Transformer,可以只需要一…

引言

这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。

传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。
这篇论文提出了Glancing Transformer,可以只需要一次解码,并行地文本生成。并且效率不输于Transformer这种自回归方法。

简介

Transformer变成了最广泛使用的机器翻译架构。尽管它的表现很好,但Transformer的解码是低效的因为它采用序列自回归因子分解来建模概率,见下图1a。最近关于非自回归Transformer(non-autoregressive transformer,NAT)的研究的方向是并行解码目标token来加速生成。然而,纯粹(vanilla)的NAT在翻译质量上仍然落后于Transformer。NAT假设给定源句子后目标token是条件独立的(图1b)。作者认为NAT的条件独立假设阻碍了学习目标句子中单词的相关性(依赖关系)。这种相关性是至关重要的,通常Transformer通过从左到右解码来显示地捕获它。

在这里插入图片描述
也有一些补救方法提出了来捕获单词的相关性,同时保留并行解码。他们的共同思想是通过迭代解码目标token,每次解码都使用掩码语言模型进行训练(图1c)。因为这些模型需要多次解码,它的生成速度显著低于纯粹的Transformer。而仅单次生成的方法表现比自回归Transformer差很多。

http://www.yayakq.cn/news/126530/

相关文章:

  • 金华网站建设团队学做川菜的网站
  • 网站开发客户需求文档专业的盐城网站建设
  • 袜子技术支持北京网站建设网站怎么做评估
  • 重庆网站营销建设网站怎么收费
  • 烟台制作网站的公司哪家好网站关键字个数
  • vps做网站 推广wordpress 注册 填写密码错误
  • 商城类型的网站怎么做怎么建立一个网站开展业务
  • 青州网站建设qzfuwuwordpress分类下文章排序
  • 中国建设银行网站密码是什么昆明小程序公司
  • 接单做网站怎么开价格南宁建网站
  • 台州自助建站在线咨询wordpress的用户管理实现原理
  • 企业做网站电话约见客户的对话7一12岁手工科技小制作
  • wordpress首页分辨率外贸网站seo怎么做
  • 查建筑公司网站吴中seo网站优化软件
  • 班级网站模板html武宁网站ui专业设计
  • 建立问答类的网站内涵 网站 源码
  • 个人网站多少钱外包公司有哪些
  • 邯郸网站建设咨询安联网络门户网站那个程序比较
  • 速效成交型网站平面设计软件大全免费
  • 外贸在什么网站做天津众业建设工程有限公司网站
  • html5网站演示大连企业网站模板
  • jsp网站开发实例pdf青岛李沧区城乡建设局网站
  • 海南网站建设及维护深圳网站建设服务哪家好
  • 阜宁企业做网站多少钱公司装修开工大吉贺词
  • 123手机浏览器wordpress商城主题 优化
  • 哪些网站是503错误代码wordpress模板企业
  • 旅游网站怎么做才能被关注香水推广软文
  • 我做网站编辑写文章很慢怎么办中国建筑招聘官方网站
  • 标准化信息网站建设与应用公司网页设计说明300
  • 黄埭做网站建设一个营销网站的费用