当前位置: 首页 > news >正文

哈尔滨公司网站建设网站开发微信登录流程

哈尔滨公司网站建设,网站开发微信登录流程,wordpress check_admin_referer,wordpress采集图片不显示一.论文 1.1 P-tuning 区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中 上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入pro…

一.论文

1.1 P-tuning

区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中

上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入promote的过程可以表示为

其中x代表一系列离散的输入令牌,y代表目标(可以理解为希望模型想要给你的回答),e()表示对应的embedding,其实就是将其参数化映射成为伪tokens,即

通过最小化这些参数

1.2 promote生成

嵌入的promote实际上可以理解为不一定离散不相互关联的,而实际上的promote其实应该是高度离散的且具有关联性的,因此作者选择使用双向长短期记忆网络(LSTM),激活函数和MLP来建模这种关系

在推理中,我们只需要输出嵌入h,并且可以丢弃LSTM头

二.代码

本质上是使用一个PromptEncoder来生成伪的embedding添加到原先的embedding中

2.1 训练

训练过程只更新promote_encoder中的参数

 2.1.1 PromptEncoder

在PTuneForLAMA中实例化了PromptEncoder

 PromptEncoder本质上是一个(嵌入 + LSTM + MLP)

import torch
import torch.nn as nnclass PromptEncoder(torch.nn.Module):def __init__(self, template, hidden_size, tokenizer, device, args):super().__init__()self.device = deviceself.spell_length = sum(template)self.hidden_size = hidden_sizeself.tokenizer = tokenizerself.args = args# ent embeddingself.cloze_length = templateself.cloze_mask = [[1] * self.cloze_length[0]  # first cloze+ [1] * self.cloze_length[1]  # second cloze+ [1] * self.cloze_length[2]  # third cloze]self.cloze_mask = torch.LongTensor(self.cloze_mask).bool().to(self.device)self.seq_indices = torch.LongTensor(list(range(len(self.cloze_mask[0])))).to(self.device)# embeddingself.embedding = torch.nn.Embedding(len(self.cloze_mask[0]), self.hidden_size).to(self.device)# LSTMself.lstm_head = torch.nn.LSTM(input_size=self.hidden_size,hidden_size=self.hidden_size // 2,num_layers=2,dropout=self.args.lstm_dropout,bidirectional=True,batch_first=True)self.mlp_head = nn.Sequential(nn.Linear(self.hidden_size, self.hidden_size),nn.ReLU(),nn.Linear(self.hidden_size, self.hidden_size))print("init prompt encoder...")def forward(self):input_embeds = self.embedding(self.seq_indices).unsqueeze(0)output_embeds = self.mlp_head(self.lstm_head(input_embeds)[0]).squeeze()return output_embeds

2.1.2 调用

在PTuneForLAMA的forward函数中调用了embed_input来实现

http://www.yayakq.cn/news/229035/

相关文章:

  • 网站内容填写wordpress打开install
  • 安贞街道网站建设fizz wordpress
  • 2021年手机能看的网站成都市微信网站建设报价
  • 电商网站制作成手机appwap网址是什么意思
  • 钱多网站东莞专业网站建设平台
  • 建设银行交学费网站3d 网站设计
  • 怎样做美瞳网站个人商城网站能备案吗
  • 网站虚拟主机里的内容强制删除wordpress添加分页
  • 网站网页设计平台洛可可公司设计的产品
  • 松江专业做网站公司给公司做网站多钱
  • wordpress中英文站点网站开发培训周末班
  • 搜狗官方网站WordPress个人知识库
  • 石家庄市住房建设局网站好一点的网站建设公司
  • 网站专题页是什么wordpress 微博分享 searchpic=
  • 跨境电商自己做网站引流网站投票活动怎么做
  • wordpress个人网站后台登陆沈阳企业黄页免费
  • 做购物网站用什么应用建网站做商城个体户资质可以
  • 宝安做网站公司企业管理网站建设
  • 深圳网站设计与制作公司化妆品网站建设推广方案
  • 上孩做网站常州网站制作公司排名
  • 勾线外包网站贵州网站制作公司
  • 怎样做网站的外链套餐网站
  • 建设营销网站多少钱番禺厂家关键词优化
  • 苏州优化网站排名wordpress主题文件路径
  • wordpress网站音乐播放器wordpress中文主题开发框架
  • 服务器怎么做网站教程乐高编程培训
  • 标书制作收费标准seo外贸公司推广
  • 临沂市罗庄区住房和建设局网站中小型网站建设价格
  • 下载网站软件免费安装购物网站首页界面设计
  • 上海珍岛网站建设app软件制作器