当前位置: 首页 > news >正文

苏州品牌网站设计开发做网站的销售好做吗

苏州品牌网站设计开发,做网站的销售好做吗,做网站西宁,合肥网站建设q479185700惠文章目录 7.前馈网络8.加法和归一化组件9.组合所有编码器组件构成完整编码器 7.前馈网络 编码器块中的前馈网络子层如下图所示: 图1.32 – 编码器块 前馈网络由两个带有ReLU激活函数的全连接层组成。全连接层(Fully Connected Layer)有时也…

文章目录

    • 7.前馈网络
    • 8.加法和归一化组件
    • 9.组合所有编码器组件构成完整编码器


7.前馈网络

编码器块中的前馈网络子层如下图所示:

在这里插入图片描述

图1.32 – 编码器块

前馈网络由两个带有ReLU激活函数的全连接层组成。全连接层(Fully Connected Layer)有时也称为密集层,即每一层的每个神经元都与上一层的所有神经元相连。在Transformer的前馈网络中,这样的密集层有两个。

第一个密集层将输入数据映射到一个更高维度的空间。

第二个密集层则将第一个密集层的输出映射回原始维度。

在这两个密集层之间,通常会加入ReLU(Rectified Linear Unit)激活函数。ReLU激活函数的定义如下:

f(x) = max(0,x)

这意味着,ReLU函数会将所有负数输入映射到0,而正数输入保持不变。ReLU激活函数有助于引入非线性因素,使得神经网络能够学习和模拟更复杂的函数。

前馈网络的参数在不同的句子位置上是相同的,但在不同的编码器块上是不同的。

在下一节中,我们将介绍编码器的另一个组件——加法和归一化组件。

8.加法和归一化组件

在Transformer的编码器中还有一个重要的组件,加法和归一化组件。它连接着一个子层的输入和输出。也就是说,如下图所示(虚线),我们可以观察到加法和归一化组件:

(1)将多头注意力子层的输入连接到其输出

(2)将前馈子层的输入连接到其输出

在这里插入图片描述

图1.33 – 带有加法和归一化组件的编码器块

加法和归一化组件基本上是一个残差连接,后面跟着层归一化。层归一化通过防止每层中的值发生重大变化,从而可以得到更快的训练。

现在我们已经了解了编码器的所有组件,让我们在下一节中将它们全部放在一起,看看编码器作为一个整体是如何工作的。

9.组合所有编码器组件构成完整编码器

下图显示了两个编码器的堆叠(为了看上去更加简洁清晰,只展开了编码器1):

在这里插入图片描述

图1.34 – 编码器堆叠,仅编码器1展开

从图1.34所示的编码器中,我们可以看到:

(1)首先,我们将输入转换为输入嵌入(嵌入矩阵embedding matrix),然后添加位置编码(position encoding)并作为输入喂给最底层的编码器(encoder 1)。

(2)编码器1接收到输入后,将其发送到多头注意力(multi-head attention)子层,多头注意力子层运算后输出注意力矩阵(attention matrix)。

(3)将注意力矩阵作为输入喂给下一个子层——前馈网络。前馈网络接收注意力矩阵作为输入,并输出编码器表示(encoder representation)。

(4)接下来,我们取编码器1的输出(encoder representation)并将其作为输入喂给下一级编码器(encoder 2)。

(5)编码器2执行相同的流程,并输出给定输入句子的编码器表示(encoder representation)。

我们可以将N个编码器一个接一个地逐层堆叠;最后一级的编码器(最顶层编码器)获得的输出(encoder representation)将是给定输入句子的表示(representation)。让我们将最终编码器(在我们上面所举的例子中是编码器2)获得的编码器表示记为R。

我们取最终编码器(编码器2)获得的编码器表示R,并将其作为输入喂给解码器。解码器接收编码器表示R作为输入,并尝试生成目标句子。

现在我们已经理解了transformer的编码器部分,下一节我们将详细介绍解码器是如何工作的。


感谢您的阅读,欢迎关注!


http://www.yayakq.cn/news/592589/

相关文章:

  • 门户网站开发要多少钱沈阳做网站公司哪家好
  • 湖北网站建设联系电话wordpress设置免审核
  • 思帽网站建设贵阳好的网站建设
  • 九江网站建设服务网站建设服装市场分析报告
  • 在线做交互网站wordpress的缺点
  • 网站建设实训心得体会目前主流搜索引擎是哪种
  • 高密做网站的价位门户网站建设统计表
  • 典型网站开发的一般流程wordpress页码颜色
  • 专业搜索引擎seo服务商网站优化及推广方案
  • 无锡网站建设企业学历提升的重要性
  • 国外服务器做网站wordpress可以装在子目录下
  • 美工怎么做网站效果图哪些网站用户体验好
  • 网站体验分享做网站花都区
  • 有免费制作单页的网站吗浙江省住房和城乡建设厅网站查询
  • 网站页面设计欣赏模板天津网站建设设计
  • 网站外包注意事项3d动画制作自学教程
  • 网站如何做单项链接汉中软件开发项目管理
  • 做的比较简约的网站网站建设案例欣赏
  • 网站建设方案封面武清做网站的
  • 电脑做网站空间公众号开发者密码重置
  • 网页设计欣赏英文seo网站页面诊断
  • 中山金舜家庭用品有限公司怎样网站地图大专软件技术好就业吗
  • 企业网站建设合同书盖章页马鞍山人才网
  • 品牌网站推广软件access建网站
  • 辽宁智能网站建设价位wordpress 多分类
  • 免费个人网站空间申请贵州省两学一做网站
  • 信息类网站怎么做网络销售平台有哪些软件
  • 网站设计培训成都哪家好建湖做网站
  • 网站推广易网宣wordpress用户自定义作者
  • 网站开发怎样验收行业网站建设哪家好