当前位置: 首页 > news >正文

即墨网站制作域名备案需要有网站吗

即墨网站制作,域名备案需要有网站吗,花灯彩灯制作公司,大连 建网站文章目录 1、自注意力机制2、多头注意力机制 transformer的整体结构: 1、自注意力机制 自注意力机制如下: 计算过程: 代码如下: class ScaledDotProductAttention(nn.Module):def __init__(self, embed_dim, key_size, value_…

文章目录

  • 1、自注意力机制
  • 2、多头注意力机制

  • transformer的整体结构:
    在这里插入图片描述

1、自注意力机制

  • 自注意力机制如下:
    在这里插入图片描述
  • 计算过程:
    在这里插入图片描述
  • 代码如下:
class ScaledDotProductAttention(nn.Module):def __init__(self, embed_dim, key_size, value_size):super().__init__()self.W_q = nn.Linear(embed_dim, key_size, bias=False)self.W_k = nn.Linear(embed_dim, key_size, bias=False)self.W_v = nn.Linear(embed_dim, value_size, bias=False)def forward(self, x, attn_mask=None):"""Args:X: shape: (N, L, embed_dim), input sequence, 是经过input embedding后的输入序列,L个embed_dim维度的嵌入向量attn_mask: (N, L, L),用于对注意力矩阵(L, L)进行mask输出:shape:(N, L, embed_dim)"""query = self.W_q(x)  # (N, L, key_size)key = self.W_k(x)  # (N, L, key_size)value = self.W_v(x)  # (N, L, value_size)scores = torch.matmul(query, key.transpose(1, 2)) / math.sqrt(query.size(2))if attn_mask is not None:scores = scores.masked_fill(attn_mask, 0)attn_weights = F.softmax(scores, dim=-1)	# dim为-1表示,对每个嵌入向量与其他所有向量的注意力权重,进行softmax,以使每一行的和为1return torch.matmul(attn_weights, value)

2、多头注意力机制

  • 结构如下:
    在这里插入图片描述
  • 计算过程如下:
class MultiHeadSelfAttention(nn.Module):def __init__(self, embed_dim, num_heads, key_size, value_size, bias=False):super().__init__()self.embed_dim = embed_dimself.num_heads = num_headsself.q_head_dim = key_size // num_headsself.k_head_dim = key_size // num_headsself.v_head_dim = value_size // num_headsself.W_q = nn.Linear(embed_dim, key_size, bias=bias)self.W_k = nn.Linear(embed_dim, key_size, bias=bias)self.W_v = nn.Linear(embed_dim, value_size, bias=bias)        self.q_proj = nn.Linear(key_size, key_size, bias=bias)self.k_proj = nn.Linear(key_size, key_size, bias=bias)self.v_proj = nn.Linear(value_size, value_size, bias=bias)self.out_proj = nn.Linear(value_size, embed_dim, bias=bias)def forward(self, x):"""Args:X: shape: (N, L, embed_dim), input sequence, 是经过input embedding后的输入序列,L个embed_dim维度的嵌入向量Returns:output: (N, L, embed_dim)"""query = self.W_q(x)  # (N, L, key_size)key = self.W_k(x)  # (N, L, key_size)value = self.W_v(x)  # (N, L, value_size)q, k, v = self.q_proj(query), self.k_proj(key), self.v_proj(value)N, L, value_size = v.size()q = q.reshape(N, L, self.num_heads, self.q_head_dim).transpose(1, 2)k = k.reshape(N, L, self.num_heads, self.k_head_dim).transpose(1, 2)v = v.reshape(N, L, self.num_heads, self.v_head_dim).transpose(1, 2)att = torch.matmul(q, k.transpose(-1, -2)) / math.sqrt(k.size(-1))att = F.softmax(att, dim=-1)output = torch.matmul(att, v)output = output.transpose(1, 2).reshape(N, L, value_size)output = self.out_proj(output)return output
http://www.yayakq.cn/news/373785/

相关文章:

  • 宁波正规站内优化seo软件设计的方法
  • 为什么要选择高端网站定制网站建设与维护总结
  • 浙江建设网官方网站网站排名方案
  • 做分析图地图网站数字营销网站建设
  • 怎样创造自己的网站贵州省住房与城乡建设部网站
  • wordpress仿蛙壳网主题网站优化合同
  • 微网站技术云网站开发
  • 权威网站有哪些海外网站的建设
  • win8风格网站模板网站建设培训福州
  • 黑龙江门户网站建设柳州企业网站建设价格
  • 商业网站网站建设网站建设公司宣传册
  • 网站购物建设实训心得体会手机app下载官方免费下载安装
  • 海口网络建站模板远程服务器怎么建设自己的网站
  • 做分类网站用什么cms36氪是wordpress开发的吗
  • 建站的费用石家庄高铁招聘信息网
  • 创建一个网站的条件有哪些中国电力建设股份有限公司官方网站
  • 做盗版网站引流做视频网站赚钱
  • 网站搜索页面设计建设部造价咨询企业网站
  • 专业的网站建设科技公司做网站好的书
  • 网站开发公司属于什么行业免费搭建网站平台
  • 为什么要创建网站演出票务网站建设
  • 重庆建设施工安全管理网站wordpress安装视频
  • 可以做淘宝推广的网站吗免费网站模板psd
  • 建站 哪个网站系统好用品牌的定义
  • 网站站内文章互联苏州网站制作公司
  • 发展速度迅猛 具有丰富的网站建设经验html5 网站正在建设中
  • 京东网站建设步骤制作一个网站需要多久
  • 网站规划与建设重点内容华强北商城官网入口
  • 本网站立足于海外服务器网页浏览器是系统软件吗
  • 江北网站建设网络游戏排行榜前十名大型网络游戏