当前位置: 首页 > news >正文

怎么自己建网站赚钱注册完域名之后怎么找到网站

怎么自己建网站赚钱,注册完域名之后怎么找到网站,阿里云网站建设 部署与发布考试,网站被收录又被取消了之前讲的是如何进行fine-tune,现在讲解如何进行pre-train,如何得到一个pre train好的模型。 CoVe 其实最早的跟预训练有关的模型,应该是CoVe,是一个基于翻译任务的一个模型,其用encoder的模块做预训练。 但是CoVe需要…

之前讲的是如何进行fine-tune,现在讲解如何进行pre-train,如何得到一个pre train好的模型。

CoVe

其实最早的跟预训练有关的模型,应该是CoVe,是一个基于翻译任务的一个模型,其用encoder的模块做预训练。

但是CoVe需要大量的翻译对,这是不容易获得的,能不能通过一大段没有标注的语料进行预训练呢?

因为有监督的标注是十分费时费力的,因此采用自监督的方法。即给定一个无标签的语料,之后利用语料库自己产生一系列的标签,之后再进行对应的训练。

Predict Next Token

比较直觉的自己监督方法就是预测下一个单词是什么。给出的解法就是将一个token输入到网络中,经过softmax之后,得到下一个token的概率分布。

最早的自监督的方法就是预测下一个token是什么。

elmo & ulmfit 

其中使用LSTM做predict next token的工作有elmo,以及ulmfit。

使用self-attention的方式进行next token prediction。这种方法就是避免模型知道下一个词是什么。

语言学家认为,一个单词应该与其经常出现的单词一起出现。因此使用LSTM的时候,用隐向量编码其左边context的所有向量,就表示其前面出现的所有单词。

elmo不但关心其左边的context,还关心其右边的context。但是有一个缺点,就是其左边lstm进行编码的时候只能看到左边的token,右边的lstm进行编码的时候,只能看到右边的token。看到的句子是不完整的,这就存在问题,bert是完整的,可以解决这个问题。

但是随机的进行mask往往是会产生不好的效果的,有时候mask掉的是一个短语中的一个token,这样的话是不好出比较好的效果的。因此有方法提出了三个比较好的mask方法,其一是先分词,之后将分词(word)整个mask掉,其二是phrase-level(就是好几个word),其三是实体level的mask,就是先做ner,之后再将整个entity给mask掉,就是ERNIE模型

spanbert

spanbert方法就是也不考虑是盖住一个词,一个短语,还是一个entity了。就直接盖住一排的token。

spanBert中添加了一个新的预训练任务,SBO,即根据被盖住的左边token和右边token,之后预测被盖住的词中的第n个token。

BERT的一个太好的点就是其不善于处理生成任务,语言模型往往是给定左边的token,之后去预测右边的token,但是BERT是双向的模型,在生成任务中只能看到左边的token,是无法看到右边的token的,所以效果比较一般,

MASS/BART

之前的MASS和BART训练的是一个seq2seq的任务。但是都在输入端对原句子进行一定程度的破坏。

UniLM

UniLM是可以做encoder可以做decoder可以做seq2seq

UniLM本质上其实是一堆的transformer层的组合,并没有明确区分哪些是encoder,哪些是decoder。我们可以通过区分训练任务来对实现的任务进行区分。可以像bert一样做一个encoder,这时候可以看到整个句子中的token,像bert一样进行训练。可以像GPT一样进行decoder的训练,但是在生成的时候只能看左边的token,右边的token是不可以看的。也可以像BART和MASS一样,做encoder和decoder的任务,输入是两个句子,第一个句子可以看到全部的token,第二个句子则只可以看到左边的token。

 ELECTRA

预测mask掉的token有时候是一个比较难得事情,因此有模型ELECTRA随机得替换原始句子中的一些token,生成一些文法没有问题,但是语义怪怪得句子,之后为模型识别出哪些token被替换了,哪些token没有被替换。

但是如果随机找一个不相关的词直接替换的话,模型应该学不到什么有用的信息,所以在ELECTRA中,训练了一个小的BERT,让其生成替换的词,从而对ELECTRA进行训练

之前都是对各个token进行embedding,如何得到一个sentence的embedding呢?

Skip Thought & Quick Thought

RoBERTa & ALBERT

T5 & C4

ERNIE

还有语音版bert

http://www.yayakq.cn/news/527612/

相关文章:

  • 贵阳网站建设制作方法滁州网络推广公司
  • 中山市住房建设局网站国内有名的网站设计公司
  • 网站建设与运营公司主营业务收入与成本运城网站建设价格
  • app小程序网站开发公司网站用个人备案 2018
  • 新兴建设网站我想看女生尿频怎么办
  • 做图有什么网站html5网站开发公司
  • 景点介绍网站模板福州嵌入式培训
  • apache 配置网站网站seo怎么做的
  • 简述电子政务系统网站建设的基本过程广州网页设计师
  • 怎么做网站运营网站模板 div
  • 网页设计和网站制作郑州免费网站建设
  • 百度右边相关网站网站后台更新的内容出不来
  • 做地方网站论坛产品设计的定义
  • 机械毕业设计代做网站网站做一年了没做301
  • 哪个网站做网销更好四川响应式网站哪家好
  • 在线测评网站怎么做广州冼村是什么梗
  • 查找网站开发者襄阳做网站 优帮云
  • 杭州网站推广宣传中国城市建设控股集团有限公司网站
  • wordpress自动加载插件网络seo优化
  • 建筑人才网职位邀约是什么意思seo搜索是什么意思
  • 手机网站营销的网站重庆市建设工程信息网可以查询
  • 泰兴网站建设价格wordpress更换本地主题
  • 网站开发企业成都做网站多少钱
  • 做的最成功的网站建筑设计的主要内容
  • 长沙建站公司模板美食优秀设计网站
  • 企业品牌营销型网站建设科技网站制作案例
  • 天空台108网站找手工活带回家做linux上搭建网站
  • 网站运营方案书莒县网页设计
  • 网站建设运营的成本内部网络网站怎么做
  • 网站开发做美工商丘集团网站建设