当前位置: 首页 > news >正文

招聘网站分析如何做网页游戏网址

招聘网站分析如何做,网页游戏网址,省好多会员app,铜仁建设公司网站划分依据 基尼系数基尼系数的应用信息熵信息增益信息增益的使用信息增益准则的局限性 最近在学习项目的时候经常用到随机森林,所以对决策树进行探索学习。 基尼系数 基尼系数用来判断不确定性或不纯度,数值范围在0~0.5之间,数值越低&#x…

划分依据

    • 基尼系数
    • 基尼系数的应用
    • 信息熵
    • 信息增益
    • 信息增益的使用
    • 信息增益准则的局限性

最近在学习项目的时候经常用到随机森林,所以对决策树进行探索学习。

基尼系数

基尼系数用来判断不确定性或不纯度,数值范围在0~0.5之间,数值越低,数据集越纯。
基尼系数的计算:
假设数据集有K个类别,类别K在数据集中出现的概率为Pk,则基尼系数为:
在这里插入图片描述
上式是用来求某个节点的基尼系数,要求某个属性的基尼系数用下面的公式:
在这里插入图片描述
最后选择基尼系数最小的属性进行划分即可。

基尼系数的应用

在决策树中,假如某个节点的基尼系数就是0,此时被分类到这个节点的数据集是纯的,意思就是按照此叶节点的父节点的分类方法来说,此叶节点都是同一个类别的,不需要再次分裂决策。

信息熵

信息熵和基尼系数作用相同,都是用来度量样本集合纯度的指标。
计算方法:
在这里插入图片描述
Pk是当前样本集合中第k类样本所占比例,Ent(D)(信息熵)越小,集合D的纯度越高。

这里约定当Pk为0时Ent(D)=0;

信息增益

计算公式:在这里插入图片描述
假设现在对集合D使用属性a来进行划分,属性a有v个取值,也就是有v个节点,上式中Dv是第v个节点就是取值为v的样本个数。

信息增益的使用

信息增益越大,说明使用属性a来划分所获得的纯度提升越大,决策树越好。

信息增益准则的局限性

从上面的公式可以看出,信息增益偏好可取值数目较多的属性,假如某个属性可取值达到了n,也就是每个样本都不一样,比如“编号”属性,那可以计算出这个属性的信息增益接近1,选择这样的属性来划分很可能不具有泛化能力。
改进:
使用增益率在这里插入图片描述
对于这个公式,当属性a的可取值越多时,则IV(a)会越大,增益率变小,进行了平衡。同样的,增益率准则也有局限,它对可取值较少的属性又有所偏好。

最终:先找出信息增益高于平均水平的属性,再从中选择增益率最高的即可。

http://www.yayakq.cn/news/219927/

相关文章:

  • 做网站有什么seo排名诊断
  • html5 开发的网站智能建造就业方向及前景
  • 做聚美优品网站得多少钱静安企业网站建设
  • 朝阳网站建设怎么样百度管理员联系方式
  • 织梦网站被挂马怎么处理腾讯广告投放平台
  • 企业vi设计公司标准版seo优化在线
  • 网站群系统建设标准安顺建设局网站
  • 东莞手机手机端网站建设dede中英文企业网站
  • 最好用的免费建站平台雅布设计
  • 手机上上建设网站百度seo怎么关闭
  • 长沙h5手机网站制作游戏工作室加盟
  • 成都定制网站建wordpress 2
  • 汾阳做网站网站必须天天更新吗
  • 网站26个页面收费哈尔滨建站
  • 电子商务网站规划与管理鄂州网站设计制作公司
  • 用c 做网站和数据库方法哪些网站页面简洁
  • 做兼职最好的网站有哪些没有域名怎么访问网站
  • 大兴网站设计怎么攻击网站
  • 用网站做赌彩广告ui界面设计尺寸
  • 环保网站设计是什么杭州免费自助建站模板
  • 企业管理顾问东莞网站建设软件开发模型比较
  • 东莞市网站建设哪家好中国做木线条的网站
  • 怎样分析网站做seo安装多个wordpress站点
  • 人力招聘网站建设任务执行书wordpress 替换主题图片
  • 查找网站后台的软件招投标网
  • 上海网站建设 微信开发公司个人网站建设主要功能
  • 网站建设信息发布平台广告设计就业率
  • 放单网站建设网站开发谷歌浏览器js不更新
  • seo基础教程宁阳网站seo推广
  • 如何在交易网站做电子印章wordpress 微信登录key