当前位置: 首页 > news >正文

国外做旅游攻略的网站网站建设的主要工作内容

国外做旅游攻略的网站,网站建设的主要工作内容,17173论坛,收费网站解决方案1、GPT2Tokenizer 用于将文本数据转换为适合训练和预测的格式,主要功能是将输入的文本进行分词、编码等操作,以便在神经网络中使用 keras_nlp.models.GPT2Tokenizer(vocabulary, merges, **kwargs) 参数说明 vocabulary:一个字典&#x…

1、GPT2Tokenizer

用于将文本数据转换为适合训练和预测的格式,主要功能是将输入的文本进行分词、编码等操作,以便在神经网络中使用

keras_nlp.models.GPT2Tokenizer(vocabulary, merges, **kwargs)
参数说明 
  • vocabulary一个字典,包含词汇表的映射关系。键是单词,值是对应的索引。
  • merges一个列表,包含合并规则。每个元素是一个元组,表示两个需要合并的单词及其对应的索引。
  • **kwargs其他可选参数。
示例
from keras_nlp.models import GPT2Tokenizer# 定义词汇表和合并规则
vocabulary = {"hello": 1, "world": 2, "!": 3}
merges = [(1, 2)]# 创建分词器实例
tokenizer = GPT2Tokenizer(vocabulary, merges)# 对文本进行分词和编码
text = "hello world!"
encoded_text = tokenizer.encode(text)
print(encoded_text)  # 输出:[1, 2, 3]# 对编码后的文本进行解码
decoded_text = tokenizer.decode(encoded_text)
print(decoded_text)  # 输出:"hello world!"

 

2、from_preset

GPT2Tokenizer.from_preset()是Hugging Face的Transformers库中的一个函数,用于从预定义的预设中加载一个GPT-2分词器。这个函数可以帮助你快速地创建一个适用于特定任务的分词器,而无需从头开始训练。

GPT2Tokenizer.from_preset("gpt2_base_en")
参数说明 

在这个例子中,我们加载的是"gpt2_base_en"预设,它包含了英文版本的GPT-2模型的基本参数和词汇表

示例
from transformers import GPT2Tokenizer# 创建分词器
tokenizer = GPT2Tokenizer.from_pretrained("gpt2_base_en")# 对输入进行分词
tokens = tokenizer("The quick brown fox tripped.")
print(tokens)  # 输出:{'input_ids': [31474, 2024, 2003, 1037, 2327, 102], 'attention_mask': [1, 1, 1, 1, 1, 1]}# 对输入进行反分词
text = tokenizer.decode(tokens['input_ids'])
print(text)  # 输出:"The quick brown fox tripped."
  • gpt2_base_en:这是一个12层的GPT-2模型,参数量为124.44M,保持了大小写。它使用WebText数据集进行训练。
  • gpt2_medium_en:这是一个24层的GPT-2模型,参数量为354.82M,保持了大小写。它也使用WebText数据集进行训练。
  • gpt2_large_en:这是一个36层的GPT-2模型,参数量为774.03M,保持了大小写。同样使用WebText数据集进行训练。
  • gpt2_extra_large_en:这是一个48层的GPT-2模型,参数量为1.56B,保持了大小写。它也使用WebText数据集进行训练。
  • gpt2_base_en_cnn_dailymail:这是一个12层的GPT-2模型,参数量为124.44M,保持了大小写。它使用CNN/DailyMail摘要生成数据集进行微调。
http://www.yayakq.cn/news/759189/

相关文章:

  • 服务器做网站流程青岛网络服务公司
  • seo 网站title网站备案信息怎么做
  • 做网站买域名怎么弄美橙互联网站管理后台
  • 建设学习网站网站的管理包括
  • 高端网络建站怎样不用代码就能建网站
  • 深圳有几个燃气公司郑州网站排名优化外包
  • 泰安营销型手机网站建设有哪些网站是静态网站
  • php网站设计wordpress导航栏颜色
  • 永康电子商务网站建设莱芜雪野湖风景区
  • 如何做企业网站沂源放心企业网站建设方案报价
  • 中国建设网站轨道自检验收报告表中文书店网站模板
  • 网站需要服务器吗珠宝网站形象设计
  • 吉林省建设工程造价信息网站网站搭建工具
  • 网站设计用处网站整站下载带数据库后台的方法
  • 宁波网站建设的价格表360搜索的网站收录入口
  • 广州网站制作托管下载软件的网站推荐
  • 网站建设税种分类制作营业执照图片手机软件
  • 怎样做模具钢网站利用百度网盘自动播放做视频网站
  • 做易买网网站项目心得体会wordpress api json
  • 淮安企业网站制作大连建设主管部门官方网站
  • 产权交易网站建设方案地方门户网站系统
  • 制作网站用c 做前台企业网站结构图
  • 万盛网站建设公司做问卷的网站生成二维码
  • 安徽长江建设集团有限公司网站网站底部广告代码
  • asp.net免费网站网站的优势是什么
  • 怎样做才能让网站更受关注徐州网站建设
  • 天津做网站推广的网站云南建筑工程网
  • 快速建设房产网站微网站中加入一键拨号功能代码
  • 服装设计素材网站大全升级wordpress需要ftp
  • 环球贸易网站wordpress商城主题 原创