当前位置: 首页 > news >正文

中国著名的网站建设公司广州网站建设网站制作

中国著名的网站建设公司,广州网站建设网站制作,公司邮箱手机怎么登录,seo网站营销推广全程实例 pdf把原始语料中的每个句子通过截断和填充,转换成一个固定长度的句子,并将所有数据整理成mini-batch,用于训练模型,下面代码参照paddle官方 # 库文件导入 # encodingutf8 import re import random import requests import numpy as n…

把原始语料中的每个句子通过截断和填充,转换成一个固定长度的句子,并将所有数据整理成mini-batch,用于训练模型,下面代码参照paddle官方


# 库文件导入
# encoding=utf8
import re
import random
import requests
import numpy as np
import paddle
from paddle.nn import Embedding
import paddle.nn.functional as F
from paddle.nn import LSTM, Embedding, Dropout, Linear
import os
import jieba
import paddle.fluidimport build_dict
import convert_corpus_to_id
import data_preprocess
import load_comment# 编写一个迭代器,每次调用这个迭代器都会返回一个新的batch,用于训练或者预测
def build_batch(word2id_dict, corpus, batch_size, epoch_num, max_seq_len, shuffle = True, drop_last = True):# 模型将会接受的两个输入:# 1. 一个形状为[batch_size, max_seq_len]的张量,sentence_batch,代表了一个mini-batch的句子。# 2. 一个形状为[batch_size, 1]的张量,sentence_label_batch,每个元素都是非0即1,代表了每个句子的情感类别(正向或者负向)sentence_batch = []sentence_label_batch = []for _ in range(epoch_num): #每个epoch前都shuffle一下数据,有助于提高模型训练的效果#但是对于预测任务,不要做数据shuffleif shuffle:random.shuffle(corpus)for sentence, sentence_label in corpus:sentence_sample = sentence[:min(max_seq_len, len(sentence))]if len(sentence_sample) < max_seq_len:for _ in range(max_seq_len - len(sentence_sample)):sentence_sample.append(word2id_dict['[pad]'])sentence_sample = [[word_id] for word_id in sentence_sample]sentence_batch.append(sentence_sample)sentence_label_batch.append([sentence_label])if len(sentence_batch) == batch_size:yield np.array(sentence_batch).astype("int64"), np.array(sentence_label_batch).astype("int64")sentence_batch = []sentence_label_batch = []if not drop_last and len(sentence_batch) > 0: # 控制样本数量不能被批次整除时的行为,若为真则丢弃最后一批样本yield np.array(sentence_batch).astype("int64"), np.array(sentence_label_batch).astype("int64")train_corpus =  load_comment.load_comment(True)
train_corpus = data_preprocess.data_preprocess(train_corpus)
word2id_freq, word2id_dict = build_dict.build_dict(train_corpus)
train_corpus = convert_corpus_to_id.convert_corpus_to_id(train_corpus, word2id_dict)for batch_id, batch in enumerate(build_batch(word2id_dict, train_corpus, batch_size=3, epoch_num=3, max_seq_len=40)): # 此处train_corpus输入的是covert_corpus_to_id之后的内容print(batch)break```
http://www.yayakq.cn/news/268523/

相关文章:

  • 网站运营职业分析优质网站建设方案
  • 普通网站服务器国内国际时事最新消息
  • 电商网站开发视频台州行app官网下载
  • 桐乡市住房建设局网站公示小程序制作方案书
  • 制作公司网站备案需要提供什么资料域名代理商网站
  • 便捷网站建设费用电子商务网站建设与管理相关论文
  • 怎么自己做音乐网站沪尚茗居全包价格
  • 中为网站建设怀化买房网站
  • 长春站建筑官方网站查询叉车证
  • 自己网站做电子签章有效么上海平台网站建设
  • 汽车美容网站模板网站做中秋专题怎么弄
  • wordpress做的视听网站中国铁建门户网登录入口
  • 封装系统如何做自己的网站wordpress 修改布局
  • 做网站后租服务器一年多少钱深圳市龙华区大浪街道
  • 做图表好看的网站百度公司有哪些部门
  • 单页加盟网站模板织梦cms做网站流程
  • 微信网站开发工具h5免费制作平台火蚁
  • 佛山新网站制作机构威海网站建设公司
  • 商务网站建设用的是什么软件东莞网站建设(乐云践新)
  • 外贸soho怎么建网站昆山网站开发的公司
  • 网站建设发帖论坛社区什么网站可以做论文
  • 网站建设与规划专业大上海小程序开发
  • 专业做食材网站南京网络营销公司
  • 网站在哪里设置域名用前端做的比较酷的网站
  • 婚纱网站html模板建站软件排行榜
  • 推荐网站建设推广品牌推广思路
  • 租整套房做民宿的网站北京动力 网站建设
  • 装饰公司简易手机网站怎样进行网站建设
  • 网站建设需要的东西wordpress主题权限
  • wordpress网站的优化开源程序做网站