当前位置: 首页 > news >正文

网站怎么谈设计单位门户网站建设方案

网站怎么谈设计,单位门户网站建设方案,企业文化形象墙设计,临沂网站建设熊掌号微调BERT 自然语言推断任务设计了一个基于注意力的结构。现在,我们通过微调BERT来重新审视这项任务。自然语言推断是一个序列级别的文本对分类问题,而微调BERT只需要一个额外的基于多层感知机的架构,如下图中所示。 本节将下载一个预训练好的…

微调BERT

自然语言推断任务设计了一个基于注意力的结构。现在,我们通过微调BERT来重新审视这项任务。自然语言推断是一个序列级别的文本对分类问题,而微调BERT只需要一个额外的基于多层感知机的架构,如下图中所示。

本节将下载一个预训练好的小版本的BERT,然后对其进行微调,以便在SNLI数据集上进行自然语言推断。

import json
import multiprocessing
import os
from mxnet import gluon, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2lnpx.set_np()

加载预训练的BERT

原始的BERT模型有数以亿计的参数。在下面,我们提供了两个版本的预训练的BERT:“bert.base”与原始的BERT基础模型一样大,需要大量的计算资源才能进行微调,而“bert.small”是一个小版本,以便于演示。

d2l.DATA_HUB['bert.base'] = (d2l.DATA_URL + 'bert.base.torch.zip','225d66f04cae318b841a13d32af3acc165f253ac')
d2l.DATA_HUB['bert.small'] = (d2l.DATA_URL + 'bert.small.torch.zip','c72329e68a732bef0452e4b96a1c341c8910f81f')

两个预训练好的BERT模型都包含一个定义词表的“vocab.json”文件和一个预训练参数的“pretrained.params”文件。我们实现了以下load_pretrained_model函数来加载预先训练好的BERT参数。

def load_pretrained_model(pretrained_model, num_hiddens, ffn_num_hiddens,num_heads, num_layers, dropout, max_len, devices):data_dir = d2l.download_extract(pretrained_model)# 定义空词表以加载预定义词表vocab = d2l.Vocab()vocab.idx_to_token = json.load(open(os.path.join(data_dir,'vocab.json')))vocab.token_to_idx = {token: idx for idx, token in enumerate(vocab.idx_to_token)}bert = d2l.BERTModel(len(vocab), num_hiddens, norm_shape=[256],ffn_num_input=256, ffn_num_hiddens=ffn_num_hiddens,num_heads=4, num_layers=2, dropout=0.2,max_len=max_len, key_size=256, query_size=256,value_size=256, hid_in_features=256,mlm_in_features=256, nsp_in_features=256)# 加载预训练BERT参数bert.load_state_dict(torch.load(os.path.join(data_dir,'pretrained.params')))return bert, vocab

为了便于在大多数机器上演示,我们将在本节中加载和微调经过预训练BERT的小版本(“bert.small”)。在练习中,我们将展示如何微调大得多的“bert.base”以显著提高测试精度。

devices = d2l.try_all_gpus()
bert, vocab = load_pretrained_model('bert.small', num_hiddens=256, ffn_num_hiddens=512, num_heads=4,num_layers=2, dropout=0.1, max_len=512, devices=devices)

 

 

 

http://www.yayakq.cn/news/307686/

相关文章:

  • 网站服务器带宽多少合适dedecms源码
  • 建设一个私人视频网站thecontent WordPress
  • 关于加强网站信息建设的通知工程施工行业在哪个网站容易找事做
  • 建设银行金牛支行网站常用素材网站
  • 网站建设维护合同书wordpress怎么上传文件
  • 保定网站建设解决方案网站建设技术包括
  • 济南怎样做网站推广长沙人才app
  • wordpress网站很慢网络科技公司骗术
  • 佛山手机建站模板网站程序有哪些
  • 网站建设需要提供哪些信息什么网站可以看到绵阳建设
  • 网站开发技术流程龙华app网站开发
  • 没有内容的网站应该怎么做ppt模板免费下载网站哪个好
  • 深圳网站建设制作厂家网站源码本地演示
  • 商洛市住房和城乡建设局网站张家港百度网站推广
  • 可以做幻灯片的网站wordpress汉化管理界面
  • 北京网站开发教师招聘华龙网重庆新闻
  • 深圳网站建设黄浦网络-技术差做六个网站静态页多少钱
  • 苏州运营推广网站建设个人网站用主机做服务器
  • 新网站百度seo如何做什么查网站是否降权
  • 在线探测网站开发语言企业邮箱来一个
  • 网站建设开发计划模板h5页面制作工具易企秀
  • 电子商务网页设计与网站建设论文怎么做网站 白
  • 涟水县住房和城乡建设局网站外链是不是把自己的网站信息发布到别人的网站上?
  • 专业建站模板权重查询
  • 中文网站建设英文wordpress邮件
  • 网站建设案例模板下载怎么搭建一个网站教程
  • app会替代网站吗厚街镇网站建设
  • 站内优化怎么做社区网站建设方案书
  • 普洱市交通建设集团官方网站重庆做营销型网站公司
  • 做网站的分析报告案例有没有做代理商的明细网站