当前位置: 首页 > news >正文

模板建站网页广州市 网站建设建设

模板建站网页,广州市 网站建设建设,qq推广加好友,宁晋做网站NLP课程期末知识点总结 期末重点说明第01章_引言+绪论第02章_基于规则的自然语言处理第03章_文本分类第04章_语言模型第05章_文本表示第06章_卷积神经网络第07章_循环神经网络第08章_8-1_Transformer第08章_8-2_预训练模型第09章_信息抽取示例: 可能会考 一定会考 期末重点说明…

NLP课程期末知识点总结

  • 期末重点说明
  • 第01章_引言+绪论
  • 第02章_基于规则的自然语言处理
  • 第03章_文本分类
  • 第04章_语言模型
  • 第05章_文本表示
  • 第06章_卷积神经网络
  • 第07章_循环神经网络
  • 第08章_8-1_Transformer
  • 第08章_8-2_预训练模型
  • 第09章_信息抽取

示例:
可能会考

一定会考

期末重点说明

10道选择题 1分*10
8道简答题(2~3个子问题) 90分
内容:
上课课堂练习&提问模型理解
每章一个问题,CNN,transformer等等
朴素贝叶斯文本分类计算
绪论自然语言处理的基本概念
主要内容是ppt的内容,搜索资料加深对模型的理解

第01章_引言+绪论

感觉概念都不重要,应该不会默写,那也太无聊了。
语言学
语言学概念
计算语言学CL
计算语言学概念
自然语言理解NLU
自然语言理解概念
自然语言处理NLP
自然语言处理概念
中文信息处理
中文信息处理概念中文信息处理
人类语言技术HLT
Human Language Technology

各名词范围可视化
NLU\CL\NLP\HLT可视化
三种不同的语系
三种不同的语系
NLP研究内容
NLP研究内容
技术现状
技术现状
一个有意思的问题:
但是我感觉n的个数可能有错
卡特兰数

第02章_基于规则的自然语言处理

流程,依赖人类专家规则方法流程
规则方法适用的情况/任务

  • 词法分析:词法分析

可能重要一些的点:

  1. 形态还原基本算法:形态还原基本算法
  2. 分词方法罗列&缺点分词方法罗列
    缺点
  3. 词性标注看着一点不重要
  4. 命名实体识别后续课程应该有详细讲
  5. 机器翻译也只是浅浅概述

第03章_文本分类

文本分类常用数据集
文本分类常用数据集
传统机器学习方法的流程
特征表示、特征选择、分类
传统机器学习方法的流程

  • 文本的形式化表示是反映文本内容和区分不同文本的有效途径
  1. 文本表示——向量空间模型(vector space model, VSM)
    VSM
  • 特征项是词语:可称为词袋模型(bag-of-words,BOW)
  • 特征项权重特征项权重
    • 布尔变量布尔变量
    • 词频(可以直接使用次数,也可以 log ⁡ ( t f i + 1 ) \log(tf_i + 1) log(tfi+1)
      词频
      为什么要 log ⁡ ( t f i + 1 ) \log(tf_i+1) log(tfi+1)log解释
    • 逆文档频率
      • N:语料库中总文档数
      • d f t df_t dft:包含词t的文档数量
      • 如果一个词在很多文档中都出现,它的重要性就低(比如“的”、“是”)。如果一个词只在少数文档中出现,它的重要性就高(比如“黑洞”、“爱因斯坦”)。idf
      • TF_IDFtf-idf
  1. 特征选择
    1. 文档频率
      • 一个特征的文档频率是指在文档集中含有该特征的文档数目
        在这里插入图片描述
      • 互信息
        • 基本概念基本概念
        • 互信息(感觉说的不是很清楚) 在这里插入图片描述
      • 信息增益(IG):原来的熵减去已知某一特征信息后的熵IG

计算信息增益
在这里插入图片描述

  1. 分类算法
  • 监督学习
    • 生成式模型:朴素贝叶斯
      为什么朴素贝叶斯算法是生成式模型
      先理解判别式和生成式的区别区别
      朴素贝叶斯建模了 P ( x ∣ c j ) P(x|c_j) P(xcj)
      生成式说明

NB决策
M是词表大小在这里插入图片描述

判别式模型只是浅浅略过。。

  1. 文本分类性能评估
  • 正确率
  • 宏:每类求R\P后平均在这里插入图片描述
  • 微:每类TP等加起来求R\P
    在这里插入图片描述
  • P-R(纵轴P,横轴R)
  • ROC(纵轴TPR,横轴FPR)

第04章_语言模型

  1. 传统语言模型
  • n元文法
    此时还是考虑前面所有历史基元

    • 语句的先验概率:前面所有的词出现的情况下这个词出现的概率(连乘)在这里插入图片描述
      但是存在参数量爆炸的问题在这里插入图片描述
      解决问题的思路:将历史基元映射到等价类。

    引出n元文法,只考虑前面n-1个历史基元。

    <
http://www.yayakq.cn/news/450582/

相关文章:

  • 建网站无锡网站集约化建设规划
  • 产品通过网站做营销舟山网站建设有哪些
  • 官方网站建设计划书工商注册登记网
  • 企业网站项目流程做企业网站需要提供什么资料
  • 如何提高网站关键词的排名wordpress 获取用户名
  • 杭州网站建设方案python 网站开发代码
  • 公司做一个网站内容如何设计小学生网站制作
  • 网站建设包括哪些方面的费用重庆渝北网站建设
  • 开一个网站多少钱郑州营销型网站制作教程
  • 莱芜建设网站桂林尚品网络科技有限公司
  • 网站平台选择建免费网站
  • 烟台消防建设信息网站logo素材大图
  • 韩国网站源码下载做拍福利爱福利视频网站
  • 昆明网站排名优化公司哪家好网站空间 默认文档
  • 企业网站的开发建设方案怎么写河南做网站团队
  • 哪些网站可以找到兼职做报表的wordpress 去掉 顶部
  • 派点网站建设东营人力资源考试信息网官网
  • 做铝锭的网站途牛网电子商务网站建设分析
  • 什么样的网站不备案wordpress建m域名网站
  • 企业网站改版建议关键词分类工具
  • 网站优化基础互动营销的概念
  • 静态网站 apache网站建设人员性格特点
  • 快速排名网站系统校园招聘网站开发研究背景
  • 深圳建站公司推荐如何利用ps做网站
  • 小程序appld南昌seo服务
  • 网站affiliate怎么做?WordPress discuz 仿站
  • 接做网站单子的网站二手网站哪些做的比较好
  • 建行赤峰市分行 - 欢迎访问中国建设银行网站网站手机模板源码下载
  • 有做彩票网站平台的吗wordpress主题 使用
  • 陕西做网站公司哪家好个人注册公司需要多少费用