当前位置: 首页 > news >正文

深圳网站建设公司排名如何自己建个人网站

深圳网站建设公司排名,如何自己建个人网站,网站建设与管理 吴振峰,网站后台购买目录文本特征处理作用常见的文本特征处理方法添加n-gram特征说明提取n-gram文本长度规范说明实现导包问题记录心得文本特征处理作用 文本特征处理包括为语料添加具有普适性的文本特征, 如:n-gram特征 以及对加入特征之后的文本语料进行必要的处理, 如: 长度规范. 这些特征处…

目录

    • 文本特征处理作用
    • 常见的文本特征处理方法
      • 添加n-gram特征
        • 说明
        • 提取n-gram
      • 文本长度规范
        • 说明
        • 实现
        • 导包问题记录
    • 心得

文本特征处理作用

文本特征处理包括为语料添加具有普适性的文本特征, 如:n-gram特征

以及对加入特征之后的文本语料进行必要的处理, 如: 长度规范.

这些特征处理工作能够有效的将重要的文本特征加入模型训练中, 增强模型评估指标。

常见的文本特征处理方法

添加n-gram特征

说明

给定一段文本序列, 其中n个词或字的相邻共现特征即n-gram特征, 常用的n-gram特征是bi-gram和tri-gram特征, 分别对应n为2和3.

如[“我”,“爱”,“你”] 对应向量[1, 23, 45] ,我爱两个字共现且相邻(bi-gram特),用1000表示这种关系,则包含2-gram特征的向量为[1,23,45,1000]

n > 3 时 会导致算力不够,常为2, 3

提取n-gram

ngram_range = 2def create_ngram_set(input_list):"""description: 从数值列表中提取所有的n-gram特征:param input_list: 输入的数值列表, 可以看作是词汇映射后的列表:return: n-gram特征组成的集合"""return set(zip(*[input_list[i:] for i in range(ngram_range)]))ngram_set = create_ngram_set([1, 4, 9, 4, 1, 4])
print(ngram_set)

在这里插入图片描述

文本长度规范

说明

  • 规范原因:
    一般模型的输入需要等尺寸大小的矩阵, 因此在进入模型前需要对每条文本数值映射后的长度进行规范。

  • 规范过程:
    此时将根据句子长度分布分析出覆盖绝大多数文本的合理长度, 对超长文本进行截断, 对不足文本进行补齐(一般使用数字0)

实现

from keras_preprocessing import sequence# cut_len根据数据分析中句子长度分布,覆盖90%左右语料的最短长度.
cut_len = 10def padding(x_train):"""description: 对输入文本张量进行长度规范:param x_train: 文本的张量表示:return: 进行截断补齐后的文本张量表示"""# 使用sequence.pad_sequences即可完成return sequence.pad_sequences(x_train, cut_len)if __name__ == '__main__':# 假定x_train里面有两条文本, 一条长度大于10, 一天小于10x_train = [[1, 23, 5, 32, 55, 63, 2, 21, 78, 32, 23, 1],[2, 32, 1, 23, 1]]res = padding(x_train)print(res)

![在这里插入图片描述](https://img-blog.csdnimg.cn/8cee35bbdfea4f65bcdfe0f6bf6c334a.

导包问题记录

在这里插入图片描述

错误导包
from keras.preprocessing import sequence

改为
from keras_preprocessing import sequence

心得

在练习的时候如果在服务器上通过命令行方式敲写,更加需要细心,以及对报错进行思考并总结

http://www.yayakq.cn/news/189078/

相关文章:

  • 做网站在哪接单抖音小程序怎么关闭或注销
  • 郑州网站建设msggphpcms做网站页面开发
  • 大型门户网站建设工作总结自建网站外贸怎么做
  • 电子商务网站运营特价手机网站建设
  • 如何做拦截网站网站开发立项
  • 网站开发人员 怎么保存wordpress企业官网
  • 网站建设合并但与那个隆昌移动网站建设
  • 数据库网站 建设物联网工程专业主要学什么
  • wordpress自助建站wordpress 引用菜单
  • 中国交通建设集团第四工程局网站宁波网站建设与设计金字塔
  • 数据库和网站开发织梦cms和wordpress
  • 重庆网站推广优化免费网站推广软件有哪些
  • 网站底部工信部链接怎么做安徽网站建设天锐科技
  • cms建站系统 开源Wordpress手机 菜单
  • 在线制作插画网站哪家做网站的好
  • 自己做免费网站html5网站开发语言
  • 凯发网站网站做防伪查询代码
  • wordpress在线生成seo入门培训学多久
  • 做系统和做网站的区别东营网络建设
  • 网站优化工作室企业网站建设服务哪家好
  • 建设学校网站前的需求分析报告北京市建设网站
  • 绵阳做网站的公司合肥网站建设排名
  • 安徽网站设计费用wordpress首页标题怎么修改
  • 网页设计感十足的网站wordpress 标题空格
  • 网站正在建设中html修改wordpress后台登录背景
  • 金华官方网站建设潍坊市做网站的公司
  • 申请做网站wordpress 好用插件推荐
  • 申请网站空间就是申请域名友情链接互换
  • 在线注册网站阜宁网站建设
  • 网站编程培训百度公司官网