当前位置: 首页 > news >正文

网站建设波斯文wordpress 判断页面

网站建设波斯文,wordpress 判断页面,如何套用别人网站模板,制作网站开发项目的方案书目录 一、基本概念 1.1 什么是信息熵? 1.2 决策树的定义与构造 二、决策树算法 2.1 ID3 决策树 2.2 C4.5 决策树 2.3 CART 决策树 一、基本概念 1.1 什么是信息熵? 信息熵: 熵是度量样本集合纯度最常用的一种指标,代表一个系统中蕴…

目录

一、基本概念

1.1 什么是信息熵?

1.2 决策树的定义与构造

二、决策树算法

2.1 ID3 决策树

2.2 C4.5 决策树

2.3 CART 决策树 


一、基本概念

1.1 什么是信息熵?

信息熵:

熵是度量样本集合纯度最常用的一种指标,代表一个系统中蕴含多少信息量,信息量越大表明一个系统不确定性就越大,就存在越多的可能性,即信息熵越大

1.2 决策树的定义与构造

决策树是一种基于树形结构来进行决策的算法,它的主要原理是将数据集划分为一系列小的子集,每个子集称为一个决策树的“节点”,决策树的分支表示不同的决策路径,叶节点表示最终的决策结果。

在决策树的建立过程中,通常采用的是自顶向下的贪心策略,即每次选择最优的划分特征来进行节点的分裂,直到满足停止条件为止。

在选择最优的划分特征时,需要使用一些评估指标,如信息增益、基尼指数等来评估每个特征的划分能力,并选择具有最大划分能力的特征作为节点的分裂特征。

 

一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;

叶结点对应于决策结果,其他每个结点则对应于一个属性测试:

每个结点包含的样本集合根据属性测试的结果被划分到子结点中

根结点包含样本全集.从根结点到每个叶结点的路径对应了一个判定测试序列,决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单的“分而治之”

最关键的在第  8  行

如何选择最优划分属性

 

决策树的构造是一个递归的过程,有三种情形会导致递归返回:

(1) 当前结点包含的样本全属于同一类别,这时直接将该节点标记为叶节点,并设为相应的类别

对应第 2 行的 if 语句

(2) 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分,这时将该节点标记为叶节点,并将其类别设为该节点所含样本最多的类别;

对应第 5 行的 if 语句

(3) 当前结点包含的样本集合为空,不能划分,这时也将该节点标记为叶节点,并将其类别设为父节点中所含样本最多的类别。

对应第 11 行的 if 语句

二、决策树算法

2.1 ID3 决策树

ID3 决策树使用信息增益为准则来选择划分属性

信息增益: 在已知属性 (特征)a的取值后的不确定性减少的量,也即纯度的提升

信息熵 度量随机变量 X 的不确定性  越大越不确定!

 

信息增益越大,表示使用该属性划分样本集D的效果越好

因此ID3算法在递归过程中,每次选择最大信息增益的属性作为当前的划分属性

举例:

 

 显然,属性“纹理”的信息增益最大,于是它被选为划分属性

划分结果:

2.2 C4.5 决策树

 

ID3算法存在一个问题,就是偏向于取值数目较多的属性,例如:如果存在一个唯一标识,这样样本集D将会被划分为|D|个分支,每个分支只有一个样本,这样划分后的信息熵为零,十分纯净,但是对分类毫无用处。

因此C4.5算法使用了“增益率”(gain ratio)来选择划分属性,来避免这个问题带来的困扰。 

C4.5决策树并未完全使用“增益率”代替“信息增益”,而是采用一种启发式的方法先选出信息增益高于平均水平的属性,然后再从中选择增益率最高的。

首先使用ID3算法计算出信息增益高于平均水平的候选属性,接着C4.5计算这些候选属性的增益率。

2.3 CART 决策树 

CART决策树使用“基尼指数”(Gini index)来选择划分属性,基尼指数反映的是从样本集D中随机抽取两个样本,其类别标记不一致的概率,因此Gini(D)越小越好,越小表明碰到的异类的概率越小,纯度就越高

基尼指数越小,表明集合越纯 

选择基尼指数最小的属性作为最优划分属性

 

http://www.yayakq.cn/news/697935/

相关文章:

  • 双语企业网站做古代风格头像的网站
  • 廊坊网站推广外包网站建设与运行的盈利收入
  • 网站改版 建设方案做外卖那些网站好
  • 商业网站推广wordpress 积分购物
  • 合肥网站开发建设wordpress响应式播放器
  • 网站会员管理系统网站设计服务平台
  • 牙医工具网站建设课程设计报告建设网站大概多少钱
  • 百度网站建设四川省建设厅安全员报名网站
  • 金华住房和城乡建设厅网站一个网站要注意哪些问题
  • 晋城北京网站建设网络教育网站如何做营销推广
  • flash网站链接怎么做吴忠市利通区建设局网站
  • 公司网站设计广州wordpress模板chinaz
  • 门户网站栏目规范化建设百度电商平台
  • 建公司网站步骤启东网站建设
  • 网站设计公司行业排名赣州网站建设百家号
  • 网站建设 免费夏邑县城乡建设规划局网站
  • 百度推广方案怎么写seo工程师是做什么的
  • 中国建设银行网站首页签约创建一个购物网站需要什么
  • 英德网站建设做亚马逊有看数据的网站吗
  • 网站仿制公司广州门户网站建设公司
  • 网站优化页面wordpress 正在建设插件
  • 注册一个网站流程网站seo综合公司
  • 商务网站价格俄文网站引擎
  • wordpress 框架嵌入搜索引擎优化介绍
  • 巴中哪里做网站个人网站制作总体设计
  • html下载网站模板专业的建设网站
  • 自己做网站需要做啥公司网站制作税目
  • 建站平台需要授权吗陕西省建设厅网站ca验证失败
  • 如何建立虚拟架构网站下沙开发区建设局网站
  • 网站运维可以做哪些怎么做相册网站