当前位置: 首页 > news >正文

美食网站建设的时间进度表医院网站建设 招标

美食网站建设的时间进度表,医院网站建设 招标,用html做网站,网站后台默认密码NeuralNLP-NeuralClassifier的使用记录,训练预测自己的英文文本多分类 NeuralNLP-NeuralClassifier是腾讯开发的一个多层多分类应用工具,支持的任务包括,文本分类中的二分类、多分类、多标签,以及层次多标签分类。支持的文本编码…

NeuralNLP-NeuralClassifier的使用记录,训练预测自己的英文文本多分类

NeuralNLP-NeuralClassifier是腾讯开发的一个多层多分类应用工具,支持的任务包括,文本分类中的二分类、多分类、多标签,以及层次多标签分类。支持的文本编码模型包括 FastText, TextCNN, TextRNN, RCNN, VDCNN等。这篇博客将介绍如何使用这个项目实现文本的多标签多分类任务。

这里记录本人的英文文本分类,总共分6类。数据背景是:

2023 国际高等教育数学成型竞赛-A题 购物评论的数据分析的英文评论数据。

NeuralNLP-NeuralClassifier项目代码地址:
GitHub项目原开源代码

文章末有本次实验全部代码和数据。上传百度网盘,下载解压即可使用

项目目录介绍:

|--conf     # config文件存放目录
|--data    # 所有数据和schema存放目录
|--dataset  # 构建dataloader所需脚本
|--evaluate
|--model|--classification   # 项目中使用到的所有特征编码器|--attention.py|--embedding.py|-- ......  各模型通用的一些模块
|--predict.txt    # 执行预测生成的预测结果
|--checkpoint_dir_{}  # 训练过程中保存下来的权重文件目录
|--dict_{}              # 加载数据时产生的缓存文件目录
|--train.py            # 官方提供的训练脚本
|--eval.py            # 官方提供的评估脚本
|--predict.py        # 官方提供的预测脚本

在这里插入图片描述

一、构建自己的数据集格式

数据样式很简单,逐行的json格式,包括四个字段,使用者需要按照如下的形式去组织数据:

{"doc_label":["Computer--MachineLearning--DeepLearning", "Neuro--ComputationalNeuro"],"doc_token": ["I", "love", "deep", "learning"],"doc_keyword": ["deep learning"],"doc_topic": ["AI", "Machine learning"]
}"doc_keyword" and "doc_topic" are optional.

在这里插入图片描述

"doc_label"就是这篇文档对应的所有标签构成的list,如果是单分类任务,list的长度为1,层次分类任务,各层之间用“–”进行分隔;

"doc_token"是这篇文档对应的所有token,中文可以使用各种分词工具进行分词。

“doc_keyword” 和"doc_topic"是在fasttext算法中提供额外的输入特征的,可以不提供,但是这两个字段必须要有,可以置为空。

二、构建自己的数据集:

自己数据数据处理成JSON文件,一段英文文本的标签,以及它的文本的词等等…

如何构建自己数据集url

在这里插入图片描述

在这里插入图片描述

编写自己数据的文本标签类别,我这里是数字标签,也可以文本标签,代表自己数据集总共有哪些标签。

后面的训练配置文件需要填入该文件的路径

三、训练:

模拟conf/train.json,自己数据就得写训练配置参数:

在这里插入图片描述

训练配置参数主要修改:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

训练命令:

终端命令界面:

python train.py conf/english_train_conf.json

训练完后会生成相应的文件夹:有保存模型权重的、以及记录训练的:

在这里插入图片描述

验证命令:

python eval.py conf/english_train_conf.json

运行完后会生成混淆矩阵,评价指标:

在这里插入图片描述

四、预测:

预测时,构造预测数据,类似于训练的数据集,只是label为空:

处理待测的数据集,处理成JSON文件,如何处理,请看另一篇博文:
NeuralNLP-NeuralClassifier的使用记录(二),训练预测自己的【中文文本多分类】

在这里插入图片描述

在这里插入图片描述

放入文件夹:

在这里插入图片描述

预测命令:

python predict.py conf/english_train_conf.json englishdata/pridetct.json 

预测完后:

会生成predict.txt文本,txt里每一行就是每一个英文文本的预测分类:

在这里插入图片描述

代码获取:

链接:https://pan.baidu.com/s/1PSA_0rMAzVBNGUmZQBczdw
提取码:2023

http://www.yayakq.cn/news/167719/

相关文章:

  • 快速做网站软件项目信息网官网
  • 公司网站建设应注意哪些网站建设 定制商城 小程序开发
  • 深圳市福田区652号seo推广内容
  • 专业的建设网站哪个好自媒体135网站
  • 济南哪家做网站做安全防护信息的网站
  • 全国工程建设行业优秀网站建设网站用的软件
  • 四川西充县建设局网站深圳公司注册流程及材料
  • 深圳最专业的高端网站建设长春财经学院教务系统
  • 公司建站多少钱临武县网站建设专业
  • html5 微网站 源码站长工具之家seo查询
  • 建设检测人员证书查询网站佛山怎么做网站
  • 中山专业做网站的公司企业管理培训课程培训机构
  • 网站关键词优化seo邯郸网站建设哪儿好
  • 字画网站模板搭建商城哪家好点
  • 网站可以做固定资产吗私人订制网站推荐
  • 中医网站风格新闻写作网站
  • 电器网站建设规划书wordpress 朋友圈
  • 做网站赚钱吗 怎么赚企业运营管理案例分析
  • 专业公司网站开发服务搭建公司介绍网站
  • asp网站建设教案合肥建设学校官网
  • 如果做车站车次查询的网站需要什么消息信息仙桃市住房建设局网站
  • 新开传奇手游网站大全中山精品网站建设方案
  • 即给做网站又给我们做推广的公司呢建立自己的网站软件有
  • 商洛网站制作wordpress链接网盘
  • 搭建网站多少钱网络推广公司
  • 网站班级文化建设视频鹿泉网站制作公司
  • 计算机科学与技术网站网站超市
  • 北京seo网站推广网站建设制作合同
  • 深圳移动网站建设公司价格wordpress转手机
  • 网站和系统的哪个容易做深圳网站制作台