当前位置: 首页 > news >正文

网站开发哪个城市发展好网上推广怎么弄?

网站开发哪个城市发展好,网上推广怎么弄?,企业网站建设有哪些优势,教你如何建设网站引言 这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。 传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。 这篇论文提出了Glancing Transformer,可以只需要一…

引言

这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。

传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。
这篇论文提出了Glancing Transformer,可以只需要一次解码,并行地文本生成。并且效率不输于Transformer这种自回归方法。

简介

Transformer变成了最广泛使用的机器翻译架构。尽管它的表现很好,但Transformer的解码是低效的因为它采用序列自回归因子分解来建模概率,见下图1a。最近关于非自回归Transformer(non-autoregressive transformer,NAT)的研究的方向是并行解码目标token来加速生成。然而,纯粹(vanilla)的NAT在翻译质量上仍然落后于Transformer。NAT假设给定源句子后目标token是条件独立的(图1b)。作者认为NAT的条件独立假设阻碍了学习目标句子中单词的相关性(依赖关系)。这种相关性是至关重要的,通常Transformer通过从左到右解码来显示地捕获它。

在这里插入图片描述
也有一些补救方法提出了来捕获单词的相关性,同时保留并行解码。他们的共同思想是通过迭代解码目标token,每次解码都使用掩码语言模型进行训练(图1c)。因为这些模型需要多次解码,它的生成速度显著低于纯粹的Transformer。而仅单次生成的方法表现比自回归Transformer差很多。

http://www.yayakq.cn/news/845304/

相关文章:

  • 一起装修网官方网站设计ui是什么意思
  • 合肥建站公司哪代发网站建设
  • 找大连做企业网站的公司中国专利查询系统入口
  • 网站制作需要什么软件wordpress仿内涵段子
  • 中国建设银行网站用户注册怎么注册一个域名
  • 黑龙江网站建设wordpress标签页面跳转
  • 花都电子商务网站建设运城市盐湖区姚孟精诚网站开发中心
  • 岳阳网站定制门户网站建设招标书
  • 公司外贸网站西安航投集团有限公司
  • 网站头条怎么做花生壳盒子可以做网站服务器
  • 用阿里巴巴做公司网站怎么样网站字体大小选择
  • 淘宝网站建设目标网站维护需要会什么
  • 重庆平台网站推广市场营销最有效的手段
  • 福海网站制作购买网站
  • 在百度怎么做网站和推广小程序api函数
  • 网站链接跳转如何做做网站江门
  • 西安建设手机网站wordpress 添加微博关注
  • 鄞州区建网站外包自己做的网站如何上传文件
  • 做网站后付款世界排名第几
  • 珠海网站建设成功案例网站建设优化服务精英
  • 做网站的账务处理北京做网站维护
  • 国内开源网站公司简介模板免费word
  • 做酒店经理的一些网站从零开始学网站建设
  • 公司网站开发款记什么科目百度应用
  • 沈阳网站推广有什么技巧wordpress忘记邮箱
  • 做网站优化如何遍文章项目介绍ppt模板
  • 如何用dw做网站设计厦门市建设局电工报名网站
  • 网站做301排名会掉文员工作内容
  • 帝国cms怎么生成网站地图找大学生做家教的网站
  • 做网站去哪里接单室内设计平面图库