当前位置: 首页 > news >正文

提卡网站建设品牌建设案例

提卡网站建设,品牌建设案例,ppt做多个网站,国外网站 设计微调BERT 自然语言推断任务设计了一个基于注意力的结构。现在,我们通过微调BERT来重新审视这项任务。自然语言推断是一个序列级别的文本对分类问题,而微调BERT只需要一个额外的基于多层感知机的架构,如下图中所示。 本节将下载一个预训练好的…

微调BERT

自然语言推断任务设计了一个基于注意力的结构。现在,我们通过微调BERT来重新审视这项任务。自然语言推断是一个序列级别的文本对分类问题,而微调BERT只需要一个额外的基于多层感知机的架构,如下图中所示。

本节将下载一个预训练好的小版本的BERT,然后对其进行微调,以便在SNLI数据集上进行自然语言推断。

import json
import multiprocessing
import os
from mxnet import gluon, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2lnpx.set_np()

加载预训练的BERT

原始的BERT模型有数以亿计的参数。在下面,我们提供了两个版本的预训练的BERT:“bert.base”与原始的BERT基础模型一样大,需要大量的计算资源才能进行微调,而“bert.small”是一个小版本,以便于演示。

d2l.DATA_HUB['bert.base'] = (d2l.DATA_URL + 'bert.base.torch.zip','225d66f04cae318b841a13d32af3acc165f253ac')
d2l.DATA_HUB['bert.small'] = (d2l.DATA_URL + 'bert.small.torch.zip','c72329e68a732bef0452e4b96a1c341c8910f81f')

两个预训练好的BERT模型都包含一个定义词表的“vocab.json”文件和一个预训练参数的“pretrained.params”文件。我们实现了以下load_pretrained_model函数来加载预先训练好的BERT参数。

def load_pretrained_model(pretrained_model, num_hiddens, ffn_num_hiddens,num_heads, num_layers, dropout, max_len, devices):data_dir = d2l.download_extract(pretrained_model)# 定义空词表以加载预定义词表vocab = d2l.Vocab()vocab.idx_to_token = json.load(open(os.path.join(data_dir,'vocab.json')))vocab.token_to_idx = {token: idx for idx, token in enumerate(vocab.idx_to_token)}bert = d2l.BERTModel(len(vocab), num_hiddens, norm_shape=[256],ffn_num_input=256, ffn_num_hiddens=ffn_num_hiddens,num_heads=4, num_layers=2, dropout=0.2,max_len=max_len, key_size=256, query_size=256,value_size=256, hid_in_features=256,mlm_in_features=256, nsp_in_features=256)# 加载预训练BERT参数bert.load_state_dict(torch.load(os.path.join(data_dir,'pretrained.params')))return bert, vocab

为了便于在大多数机器上演示,我们将在本节中加载和微调经过预训练BERT的小版本(“bert.small”)。在练习中,我们将展示如何微调大得多的“bert.base”以显著提高测试精度。

devices = d2l.try_all_gpus()
bert, vocab = load_pretrained_model('bert.small', num_hiddens=256, ffn_num_hiddens=512, num_heads=4,num_layers=2, dropout=0.1, max_len=512, devices=devices)

 

 

 

http://www.yayakq.cn/news/239249/

相关文章:

  • wordpress怎么删除预建网站网站搭建免费软件
  • 那些网站可以做淘宝店铺推广企业营销型网站建设图片
  • 搜索引擎广告形式有哪些网站改版对优化的影响
  • 大连网站建网站建设设计解决方案
  • 淄博营销网站建设公司WordPress三栏资讯主题
  • 做虾皮网站外贸平台排行榜
  • vue和react可以做pc网站吗discuz好还是wordpress
  • 合肥官方网站建设优购网上商城
  • 珠海网站制作服务做竞价推广这个工作怎么样
  • 大学生网站建设实训报告传媒公司怎么注册
  • 备案关闭网站零基础做网站
  • 网站开发方式包括江苏专业做网站的公司有哪些
  • 无锡市新区建设环保局网站免费进销存软件哪个简单好用
  • 在网上做设计赚钱的网站企业品牌推广方案范文
  • 网站免费seo广东企业网站建设报价
  • 怎么做辅助发卡网站网站所有权 备案
  • 网站开发亿玛酷1专注网站关键词库
  • 网页微信客户端下载seo快速排名代理
  • 邯郸企业网站建设报价莒县网站设计
  • 搜索 龙岩网湖南专业的关键词优化
  • 网站建设业务员话术37建筑人才网
  • 公司网站自己可做吗专门做调查的网站
  • 郑州网站优化哪家专业如何更改wordpress登录密码错误
  • 个人微信注册网站哪个平台可以做推广
  • 广州学网站开发wordpress upload
  • 网站文字重叠效果国家企业信用信息查询平台
  • 自己怎么做新闻开头视频网站视频网站 wordpress主题
  • 手机网站制作公司价钱上饶网站建设srsem
  • 微网站怎么做的好名字吗哈尔滨市建设工程信息
  • 品牌网站建设哪个好怎么样从头开始做网站