当前位置: 首页 > news >正文

想找在家做的兼职 有什么网站吗wordpress表单上传多个文件

想找在家做的兼职 有什么网站吗,wordpress表单上传多个文件,怎么把网站关掉,南京建设网页培训班BERT: BERT预训练模型训练步骤: 使用Masked LM方式将语料库中的某一部分的词语掩盖住,模型通过上下文预测被掩盖的信息,从而训练出初步的语言模型在语料库中选出连续的上下语句,并使用Tranformer模块识别语句的连续性通…

BERT:

  1. BERT预训练模型训练步骤:

    1. 使用Masked LM方式将语料库中的某一部分的词语掩盖住,模型通过上下文预测被掩盖的信息,从而训练出初步的语言模型
    2. 在语料库中选出连续的上下语句,并使用Tranformer模块识别语句的连续性
    3. 通过1和2实现通过上下文进行双向预测的预训练语言表征模型
    4. 通过少量经过标记的数据以监督学习的方式对模型进行Fine-Tuning
  2. Contextualized word embedding

    BERT选择Transformer编码器作为其双向架构。在Transformer编码器中常见是,位置嵌入被加入到输入序列的每个位置。然而,与原始的Transformer编码器不同,BERT使用可学习的位置嵌入。BERT的输入序列的嵌入是词元嵌入、片段嵌入和位置嵌入的总和。
    2

  3. Masking Input(完形填空)——> self-supervised

    为了训练深度双向表征,BERT采用了一个直接的方法:随机的掩盖一定比例的Token,然后只预测这些被掩盖的Token。这个过程就是Masked LM,也被称为完形填空。在这个任务中,被掩盖的Token的最终隐藏向量被输入到词汇表的输出Softmax层,就像一个标准的语言模型一样。在BERT云训练过程中,并不总是用实际的[MASK] token替换被掩盖的单词。相反,其训练一个数据生成器来随机选择15%的token。例,在下面句子中:

    台湾大学

    选择,然后执行以下过程:

    • 80%时间中,用[Mask] Token掩盖之前的词。例如:The [Mask] is cute.
    • 10%的时间,用随机单词掩盖这个单词。例如:The playing is cute.
    • 10%的时间,保持单词不变。

    这个转换编码器不知道哪个单词将要被预测,或者哪个单词被随机单词取代。故,其必须保持每个输入Token的分布的上下文特征。另外,因为随机取代对于所有的Token来说发生的概率很低,并不会损害模型的理解能力。

    如图:
    2

    如图,对于BERT来说,输入于输出尺寸相同。在台湾大学李宏毅教授课程中,以输入序列“台湾大学”为例,模型随机将“湾”字进行遮蔽,之后对“湾”字位置的输出矩阵进行MLP处理,再通过softmax进行分类得到当前遮蔽字的分类。

  4. Next Sentence Prediction

    BERT输入为一个序列对,文本对被两个特殊的词元填充,[CLS]判断文本对的中的两个文本序列是否是相邻的(即第二个文本序列是不是第一个文本序列的next sentence)。[SEP]对文本对进行切割,是两个文本序列的分隔符。

    2

    如图,对[CLS]所在位置的输出矩阵进行二分类来判断当前序列中第二个序列是否为第一个序列的next sentence。

  5. Downstream Tasks ——> Fine-tune

    BERT网络只是一个编码器,其本身不可以完成一个特定的任务。但是因为BERT出色的架构设计,在预训练好的BERT网络后加入根据特定任务设计的解码器,并利用数据集对这个网络进行fine-tune,就可以使整个网络具有优秀的表现。
    2

    如图,这就类似于CV中的Backbone特征提取网络,只需要在BERT后加入针对下游任务设计的解码器就可完成完整的网络设计。

    不需要从零开始训练Backbone特征提取网络。再设计好下游任务解码器后,利用下游任务特定的数据集对整个预训练网络进行fine-tune就可以出色的解决问题。

    具体的下游任务包括,单文本分类、文本对分类或回归、文本标注和问答等。具体的方法和代码已经有很多成熟的方案,本人能力有限就不多做赘述。

http://www.yayakq.cn/news/210509/

相关文章:

  • seo sem 外贸建站 网站建设 文化墙设计赶集网免费发布信息网
  • 网站商城建设合同范本全国最好装修公司排行榜
  • 兴义做网站h5在线编辑
  • 简述网站开发的基本原则网站源码绑定域名处理
  • 网站建设和数据库维护中国工程建设监理网站
  • 广州网站建设找哪里wordpress 域名绑定 方块
  • p2p金融网站开发方案网站建设是用自己的服务器
  • 黄岩城乡住房和建设局网站个人做企业网站
  • 网络公司+网站建设+小程序网站建设推广咨询平台
  • 以蓝色为主色调的网站开发工具eclipse
  • 做推广都有什么网站设计网站用户需求分析报告
  • 微信平台做微文网站链接钓鱼网站盗号
  • 用户体验设计是什么做关键词优化的公司
  • 目录搜索引擎网站h5手机网站发展趋势
  • 长沙建长沙建网站公司怎么做网站 有空间
  • 蓝色经典通用网站模板微信公众号商城怎么开通
  • 如何编写一份网站开发需求文档好的seo
  • 个人网站搭建销售管理系统
  • 网站建设报价 东莞交友类网站功能建设思路
  • 网站建设的特征微信公众平台文章 wordpress
  • 淘宝联盟登记新网站wordpress收件邮箱怎么设置
  • 网站开发 工作量建盏名家罗建明简介
  • 成都网站设计与制作免费双语网站模板
  • 那些网站可以够买域名二级不死域名制作方法
  • 网站建设都包括什么江苏网站开发建设
  • 推广网站排名惠州百度推广排名
  • 四川住房和建设厅网站wordpress建站教程阿里云
  • 网站是用php还是asp 怎么区别登别的网站应怎么做
  • 广州做网站那家好山东德州如何网站建设教程
  • 大学生创业做网站武昌网站建设的公司