当前位置: 首页 > news >正文

网站搭建设计是什么意思阿里云个人网站制作

网站搭建设计是什么意思,阿里云个人网站制作,上海专业建网站,开发游戏需要什么条件前言 这是我的github上的一个介绍,关于如何训练中文版本的gpt2的。链接为: https://github.com/yuanzhoulvpi2017/zero_nlp 介绍 本文,将介绍如何使用中文语料,训练一个gpt2可以使用你自己的数据训练,用来:写新闻、…

前言

  1. 这是我的github上的一个介绍,关于如何训练中文版本的gpt2的。
  2. 链接为: https://github.com/yuanzhoulvpi2017/zero_nlp

介绍

  1. 本文,将介绍如何使用中文语料,训练一个gpt2
  2. 可以使用你自己的数据训练,用来:写新闻、写古诗、写对联等
  3. 我这里也训练了一个中文gpt2模型,使用了612万个样本,每个样本有512个tokens,总共相当于大约31亿个tokens

⚠️安装包

需要准备好环境,也就是安装需要的包

pip install -r requirements.txt

像是pytorch这种基础的包肯定也是要安装的,就不提了。

数据

数据来源

  1. 获得数据:数据链接,关注公众号【统计学人】,然后回复【gpt2】即可获得。
  2. 获得我训练好的模型(使用了15GB的数据(31亿个tokens),在一张3090上,训练了60多小时)

数据格式

  1. 数据其实就是一系列文件夹📁,然后每一个文件夹里面有大量的文件,每一个文件都是.csv格式的文件。其中有一列数据是content
  2. 每一行的content就代表一句话,截图如下
  3. 虽然数据有15GB那么大,但是处理起来一点也不复杂,使用 datasets
    包,可以很轻松的处理大数据,而我只需要传递所有的文件路径即可,这个使用 glob 包就能完成。

代码

⚙️训练代码train_chinese_gpt2.ipynb

⚠️注意

  1. 现在训练一个gpt2代码,其实很简单的。抛开处理数据问题,技术上就三点:tokenizergpt2_modelTrainer
  2. tokenizer使用的是bert-base-chinese
    ,然后再添加一下bos_tokeneos_tokenpad_token
  3. gpt2_model使用的是gpt2,这里的gpt2我是从0开始训练的。而不是使用别人的预训练的gpt2模型。
  4. Trainer训练器使用的就是transformersTrainer模块。(支撑多卡并行,tensorboard等,都写好的,直接调用就行了,非常好用)

📤推理代码infer.ipynb

⚠️注意

这个是chinese-gpt2的推理代码

  1. 将代码中的model_name_or_path = "checkpoint-36000"里面的"checkpoint-36000",修改为模型所在的路径。
  2. 然后运行下面一个代码块,即可输出文本生成结果
  3. 可以参考这个代码,制作一个api,或者打包成一个函数或者类。

🤖交互机器人界面chatbot.py

⚠️注意

  1. 修改代码里面的第4行,这一行值为模型所在的位置,修改为我分享的模型文件路径。
model_name_or_path = "checkpoint-36000"
  1. 运行
python chatbot.py
  1. 点击链接,即可在浏览器中打开机器人对话界面

更多

  1. 这个完整的项目下来,其实我都是全靠huggingface文档、教程度过来的.
  2. 我做的东西,也就是把Tokenizer改成中文的了,然后也整理了数据,别的大部分东西,都不是我做的了.
  3. 原文链接为https://huggingface.co/course/zh-CN/chapter7/6?fw=pt.

一起学习

其实,我更喜欢做应用,但是也要理解相关的背后原理,目前还在研究相关的gpt2原理还有相关的推理细节,这是我整理的链接,希望可以共同进步

  1. https://huggingface.co/blog/how-to-generate
  2. https://huggingface.co/gpt2
  3. https://huggingface.co/gpt2-large
http://www.yayakq.cn/news/306323/

相关文章:

  • 网站模板王黄山旅游攻略及费用
  • 网站建设设计文档模板下载推荐企业门户网站建设
  • 精品网站欣赏济宁网页设计
  • 中国网站建设网页设计wordpress olve
  • 公司做网站费用和人员配备视频网站建设框架
  • 帮做网站的公司企业官网入口
  • 招商网站建设公司wordpress 链接新窗口
  • 可以做描文本的网站成都网站制作推来客网站系统
  • 温州市手机网站制作哪家好wordpress 3.7.1 漏洞
  • 做网站服务费税率山东三强建设咨询有限公司网站
  • 益阳高端网站建设我有小创意设计校服图片
  • 鹤壁哪里做网站hao123网址之家设为主页
  • 网站建设与运营实践考试科技软件公司
  • 国内十大搜索引擎网站拍摄网
  • 北京环保行业网站建设国内使用wordpress的
  • 佛山市研发网站建设哪家好西安seo培训
  • 电商货源网站从化区城郊街道网站麻二村生态建设
  • 北京中国建设银行招聘信息网站北京seo排名
  • 九江网站建设网站制作快速软件开发平台
  • 宁波免费seo排名优化搜索引擎的优化和推广
  • 旅游营销网站建设建设网站明细报价表
  • 本地建设多个网站链接功能网站建设
  • 内部链接网站大全门户网站建设报告哦
  • 什么网站是用html做的门户网站百度百科
  • 国外优秀ui设计网站群晖建设网站
  • php做网站用html做吗网站开发与管理大作业
  • 网站开发会计分录用凡科做网站有自己的域名
  • 贵阳做网站公司平面设计实习报告
  • 长沙网站建设大全淄博住房和城乡建设厅网站
  • 网站目录怎么做301跳转成都网站设计公司