当前位置: 首页 > news >正文

网站推广需要数据整改吗宁波网站建设详细策划

网站推广需要数据整改吗,宁波网站建设详细策划,商城网站开发的目的和意义,郑州威盟网站建设公司怎么样NeuralNLP-NeuralClassifier的使用记录,训练预测自己的【中文文本多分类】 数据准备: ​ 与英文的训练预测一致,都使用相同的数据格式,将数据通过代码处理为JSON格式,以下是我使用的一种,不同的原数据情况…

NeuralNLP-NeuralClassifier的使用记录,训练预测自己的【中文文本多分类】

数据准备:

​ 与英文的训练预测一致,都使用相同的数据格式,将数据通过代码处理为JSON格式,以下是我使用的一种,不同的原数据情况会有所改动:

import jieba.analyse as ana
import re
import jiebadef make_data_json(df,outpath):def stop_words(path):txt = open(outpath,"r",encoding='utf-8') lines = txt.readlines()txt.close()stop_txt = []for line in lines:stop_txt.append(line.strip('\n'))return stop_txtwith open(outpath, "w+", encoding='utf-8') as f:# with open(output_path, "w") as fw:for indexs in df.index:dict1 = {}dict1['doc_label'] = [str(df.loc[indexs].values[0])]doc_token = df.loc[indexs].values[1]# 只保留中文、大小写字母和阿拉伯数字reg = "[^0-9A-Za-z\u4e00-\u9fa5]"doc_token = re.sub(reg, '', doc_token)print(doc_token)# 中文分词seg_list = jieba.cut(doc_token, cut_all=False)#$提取关键词,20个:ana.set_stop_words('./人工智能挑战赛-文本分类/停用词列表.txt')keyword = ana.extract_tags(doc_token, topK=20,withWeight=False,)   #True表示显示权重# 去除停用词content = [x for x in seg_list if x not in stop_words('../data/stop_words.txt')]dict1['doc_token'] = contentdict1['doc_keyword'] = keyworddict1['doc_topic'] = []# 组合成字典print(dict1)# 将字典转化成字符串json_str = json.dumps(dict1, ensure_ascii=False)f.write('%s\n' % json_str)

使用构造JSON数据方法:

在这里插入图片描述

训练前期准备:

1、创建中文数据文件夹,Chinese_datas,

2、创建该数据的文本数据对应的标签集Chinese_label.taxonomy

3、创建该数据的训练配置文件Chinese_train_conf.json,

继续目录如下:

在这里插入图片描述

配置文件的注意点:

在这里插入图片描述

其中需要额外修改的地方:

work_nums=0

以及涉及代码中,有读取文件的部分都需要给编码中文编码:

with open(encoding=‘utf-8’)

训练:

训练代码:

python train.py conf/Chinese_train_conf.json

训练后生成的权重文件,在配置文件中就写出了:

在这里插入图片描述

预测:

在这里插入图片描述

python predict.py conf/Chinese_train_conf.json Chinese_datas/predict_data.json

预测结果:

在这里插入图片描述

可以看出预测效果仅一个错误,该模型方便NLP的比赛分类等,准确率也很高。

代码获取:

下载就是中文分类版,在命令界面进行命令行输入,训练和预测,:

链接:https://pan.baidu.com/s/1fw_ipmOFWMiTLAFrs9i5ig
提取码:2023

http://www.yayakq.cn/news/295055/

相关文章:

  • 西宁网站建设的企业一条龙建站
  • 怎么做正规网站青海建设局网站
  • 手机电脑网站建设短视频企业信用信息查询公示系统浙江
  • 网站开发怎么赚钱做国外购物的网站怎么发货
  • 小榄网站建设推广嵌入式软件开发工程师培训
  • 简单网站如何制作宁陵做网站
  • 网站初期建设该做什么品牌建设是指什么
  • 建网站安全队徽logo设计
  • 漯河住房建设局网站上海app开发公司排名
  • 做网站公司北京建设银行网站会员用户名格式
  • 做电影网站 广告收入wap网站后台模板
  • 什么专业学做网站wordpress模板 单栏
  • 福永网站推广傻瓜化免费自助建站
  • php做的汽车销售网站燕郊医疗网站建设
  • 网站建设优化服务行情免费网站电视剧全免费的app
  • 手机网站 布局环保主题的网站模板
  • 微信公众号上微做网站开一个平台要多少钱
  • 网站被百度收录吗如何做网络推广公司
  • 专业微信网站重庆市最新新闻
  • 哪个公司可以专门做网站重庆建设网站的公司简介
  • 网站能给企业带来什么论坛网站备案
  • ps毕业设计做网站界面wordpress ssl 图片
  • 惠州市网站建设公司高端企业
  • 如何免费开自己的网站网站建设上海网站建设公司网站
  • 新云手机站官网百度手机管家
  • 做付费网站好注册安全工程师条件
  • 圣诞节网站模板定制网站建设推广方案
  • vs2010网站开发 调试 打不开页面 浏览器错误长春网站公司有哪些内容
  • 网站icp做年检绵阳手机网站建设
  • 有账号和密码怎么进公司网站后台徐州鼓楼区建设网站