当前位置: 首页 > news >正文

建设西安网站百度指数三个功能模块

建设西安网站,百度指数三个功能模块,可不可以免费创建网站,装饰设计基础知识解决思路 分解为多个独立二分类任务将多标签分类转化为多分类问题更换 loss 直接由模型进行多标签分类 数据稀疏问题 标注更多数据,核心解决方案: 自己构造训练样本 数据增强,如使用 chatGPT 来构造数据更换模型 减少数据需求增加规则弥补…

解决思路

  • 分解为多个独立二分类任务
  • 将多标签分类转化为多分类问题
  • 更换 loss 直接由模型进行多标签分类

数据稀疏问题

标注更多数据,核心解决方案:

  • 自己构造训练样本
    数据增强,如使用 chatGPT 来构造数据
  • 更换模型
    减少数据需求
  • 增加规则弥补
  • 调整阀值,用召回率替换准确率
  • 重新定义类别(类别合并)

标签不均衡问题

  • 过采样
    复制指定类别样本,在采样中重复
  • 降采样
    减少多样本类别的采样,随机使用部分样本
  • 增加标注数据
  • 调整样本权重
    调整损失函数的权重
  • 非神经网络的方法
    • 贝叶斯
      • 全概率公式
        在这里插入图片描述
      • 贝叶斯公式
        在这里插入图片描述
        • 核心在于词频的统计
        • 需要做词的独立性假设,形成每个事件在某个事件下发生概率的相乘
          这种假设是没有保障的,需要加一平滑等策略,保证概率不为0,没有考虑语序,没有词义。在这里插入图片描述
      • 适用于样本分布较均衡的语料
        • 简单高效
        • 训练结果有一定的可解释性
        • 训练数据可以分批处理
    • SVM 支持向量机
      • 找到一个决策边界
        • 即一条直线、平面或超平面
          • 实现数据的线性可分
        • 距离两个类别最近的样本距离最远
      • 是非线性不可分的
        • 可以通过使用特别的映射关系,将数据映射到高维解决
        • 通过核函数解决高维度计算耗时问题
      • 主要靠核函数寻找决策边界
      • 没有像贝叶斯很好的可解释性,没有神经网络的效果好
  • 神经网络方法
    • fastText
      • 结构简单
        1. embedding
        2. mean pooling
        3. fc -> class_num
      • 参数少,所以效果不会很好
        抛弃了语序信息
    • TextCNN
      对位相乘再相加,是有语序信息的,可以堆叠多层使用。
      • 分类
        • LSTM
        • GRU
    • Gated CNN
      在这里插入图片描述
      • 过滤 AB 相乘后为 0 部分
      • 放缩 B 中在 0-1 的部分
    • Bert
      实现方式:
      1. 取[cls] token 对应的向量
      2. 将整句话的向量取 max/average pooling
      3. 将 bert 编码后的向量再输入 LSTM 或者 CNN
      4. 将bert 中间层的结果取出,加入运算
    • Bert + RNN 或 CNN
      由于Bert 权重不是随机的,RNN 或 CNN 权重随机,为防止Bert 权重失去意义,RNN 最多一层或双向,或 CNN 最多 2-3 层。
    • 拓展
      • 对比学习
      • 海量向量查找
        • 向量数据库
          Annoy
          在多个接近的分支上查找
        • KD 树
          实现空间分割,局部对比
          均方差
          中位数
    • 目的
      预设文文本所属的类别
http://www.yayakq.cn/news/713362/

相关文章:

  • 网站制作对公司的作用discuz 调用 wordpress
  • 计算机网站的开发流程网站设计任务
  • 网站建设目录结构docwordpress 域名授权
  • 山西建设部网站做化妆招生宣传在那些网站可以做
  • 营销网站设计与规划方案仓库进销存管理软件免费版
  • 音乐网站建设视频教程wordpress 建站教程
  • 天河建设网站制作营业执照 网站开发
  • 找人做网站上线后被投诉侵权html5个人网页制作代码
  • 上海百度整站优化服务wordpress 赞
  • 设计漂亮的网站wordpress 购买按钮
  • 中邦建设工程有限公司网站北京加盟网站建设
  • 浙江住房与城乡建设部网站杭州seo关键字优化
  • 网站网页怎么压缩免费的软件网站
  • 企业做网站公司怎么做竞价推广托管服务
  • 备案期间网站可以做竞价吗域名升级维护中紧急维护
  • 手机网站开发设计包括什么网站页面设计怎么分析
  • 汝州市住房和城乡建设局网站游戏公司怎么注册
  • 中小企业网站建设问题房屋设计网站有哪些
  • 杭州正规企业网站建设上海企业查询
  • 简述创建网站的基本流程自己做动画的手机软件
  • 广东省建设工程造价管理协会网站盐城 网络推广
  • 石家庄网站建设工作室威海市建设工程协会网站
  • 潍坊公司网站建设传统营销渠道有哪些
  • 资源企业网站排名优化价格网站平台做捐助功能有风险吗
  • 网站通栏广告代码wordpress所有栏目循环输出
  • 简易广州网站建设中国建设银行上海市分行网站
  • 免费微信网站源码外贸如何选择wordpress主题
  • 广告sem是什么意思二十条优化措施全文
  • 晨光文具店网站建设计算机一级网页制作基础教程
  • 北京建设银行对公网站还能做网站的分类