当前位置: 首页 > news >正文

建网站怎么搭建自己的服务器岳阳工程造价信息网

建网站怎么搭建自己的服务器,岳阳工程造价信息网,如何做的mmd下载网站,网站备案是域名备案还是主机备案创作不易,免费的赞 前面有介绍了GPT2如何进行token化的过程,现在讲下transformer的Embedding层 Embedding层就是一个巨大的矩阵,边长分别是词汇表长度和词向量维度,矩阵里面的每一个数字都是一个随机初始化的,或者是…

创作不易,免费的赞

前面有介绍了GPT2如何进行token化的过程,现在讲下transformer的Embedding层

Embedding层就是一个巨大的矩阵,边长分别是词汇表长度和词向量维度,矩阵里面的每一个数字都是一个随机初始化的,或者是其他地方经过训练之后拿过来的。在transformer训练过程中,这些每个token的维度浮点数会发生改变。
在这里插入图片描述

在训练的过程中,假设我们窗口为50个token,意思就是我们生成下一个词的时候,只使用前面50个词去预测下个词,就算前面继续有词,我也不会应用,那么就变成下图。但是当本来就没有50个词的时候怎么办,那么需要填充字符,可以是任意字符,反正你就当成是个填充码,这里使用的是PAD,PAD在token当中也是存在的,你甚至自己定义一个token,如<<notoken!>>都可以。

为什么需要填充满50个字符,不满就不满,感觉也什么问题啊?

这是因为如果限定成50个,那么在使用显卡的训练的时候速度就可以快很多,没有的话也可以。

在这里插入图片描述

上图这个矩阵就是输入到下一个层级的矩阵,下一层就是添加位置编码,本系列中也已经有章节介绍。

http://www.yayakq.cn/news/753716/

相关文章:

  • 有哪些做短租的网站网站建设公司挣钱吗
  • 站长平台验证网站wordpress换电脑
  • 16种营销模型在线视频网站怎么做seo
  • 国内做轮胎网站网站竞争对手
  • 网站设计怎么做背景颜色wordpress删除仪表盘
  • 陕西省建设厅执业资格注册中心网站报名网站设计到底做多宽
  • php怎么做网站程序烟台网站制作山海云
  • 企业的网站公告怎么制作佛山网站架设
  • 网站维护 关站 seo提供商城网站
  • 沈阳个人网站建设代理品牌网站建设教程pdf下载
  • 只有一个页面的网站阿里外贸平台网站建设
  • 文创设计网站民宿网站的建设
  • 长沙营销型网站建设asp公司企业网站模板源代码
  • 网店装修素材网站娄底住房和城乡建设部网站
  • 怎么做网站的百度权重个人免费网站怎么建设
  • 成都seo网络优化公司济宁优化推广
  • 贵阳网站建设费用全国工商企业查询平台
  • 杭州酒店网站设计公司推荐设计可以在哪个网站接单
  • 企业网站源码挣钱吗备案网站内容格式填写
  • 网站不用域名需要备案吗wordpress 重写
  • 杭州市萧山区市场建设开发网站中国门户网站排行
  • 四川住房和城乡建设网站wordpress自媒体企业模版
  • wordpress仿站手机网站建设语言
  • 自学网站搭建门户类网站开发多少钱
  • 湖南网页设计培训网站建设东莞建设网站流程
  • 网站改版 更换域名文化建设成就
  • 网站建设维护概括总结wordpress 加相关文章
  • 石家庄集团公司网站建设Wordpress 免登录付费查看
  • 做彩票网站网址建设银行网站信任
  • 企业自适应网站制作宣传片拍摄方案策划书