当前位置: 首页 > news >正文

为某网站做一则广告语建设网站毕业设计开题报告

为某网站做一则广告语,建设网站毕业设计开题报告,网站建设的需求方案,太原h5建站决策树的基本构建流程 决策树的本质是挖掘有效的分类规则,然后以树的形式呈现。 这里有两个重点: 有效的分类规则;树的形式。 有效的分类规则:叶子节点纯度越高越好,就像我们分红豆和黄豆一样,我们当然…

决策树的基本构建流程

决策树的本质是挖掘有效的分类规则,然后以树的形式呈现

这里有两个重点:

  1. 有效的分类规则;
  2. 树的形式。

有效的分类规则:叶子节点纯度越高越好,就像我们分红豆和黄豆一样,我们当然是想把红豆和黄豆完全分开。

这里标签的纯度的衡量指标有:

  1. 分类误差;
  2. 信息熵(Entropy)
  3. 基尼系数(Gini)

我们举例来看看这三个指标是如何计算的:

对于单个数据集

假如我们有10条样本,6条0类样本,4条1类样本

则0类样本占: 6 10 \frac{6}{10} 106
1类样本占: 4 10 \frac{4}{10} 104

分类误差(1-多数类的占比): 1 − 6 10 = 0.4 1-\frac{6}{10}=0.4 1106=0.4
信息熵: − 6 10 ∗ l o g 2 6 10 − 4 10 ∗ l o g 2 4 10 = 0.97 -\frac{6}{10}*log_2\frac{6}{10}-\frac{4}{10}*log_2\frac{4}{10} =0.97 106log2106104log2104=0.97
基尼系数: 1 − ( ( 6 10 ) 2 + ( 4 10 ) 2 ) = 0.48 1-((\frac{6}{10})^2+(\frac{4}{10})^2)=0.48 1((106)2+(104)2)=0.48

对于多个数据集
在这里插入图片描述

如何计算B1,B2两个子节点整体的评估指标?

加权求和

这里以基尼系数为例

Gini_B1 = 1 − ( ( 2 5 ) 2 + ( 3 5 ) 2 ) = 0.48 1-((\frac{2}{5})^2+(\frac{3}{5})^2)=0.48 1((52)2+(53)2)=0.48

Gini_B2 = 0

Gini_B = 5 8 \frac{5}{8} 85*Gini_B1 + 3 8 \frac{3}{8} 83*Gini_B2= 5 8 ∗ 0.48 \frac{5}{8}*0.48 850.48+ 3 8 ∗ 0 \frac{3}{8}*0 830=0.3

介绍完了有效的分类规则,我们再来看看第二个重点:树的形式。
下面简单画一下二层分类树。
在这里插入图片描述
主流的决策树分类类别可划分为:

  1. D3(Iterative Dichotomiser 3) 、C4.5、C5.0决策树
  2. CART(Classification and Regression Trees)决策树
  3. CHAID(Chi-square automatic interaction detection)树

下面我们分别来看看决策树构建重点问题

1. 决策树的生长方向?

决策树生长的方向也就是令每个划分出来的子集纯度越来越高的方向

2. 如何挑选有效的分类规则?

选择信息增益最大的

假设我们有age列:
在这里插入图片描述
首先逐列对特征进行数值排序:
在这里插入图片描述
然后寻找特征不同取值之间的中间点为切点:
在这里插入图片描述
N个取值,有N-1种划分方式
这里有10个取值,所以有9种划分方式将数据集一分为二。
假设我们以10和9的中间点为划分方式
10 + 9 2 = 9.5 \frac{10+9}{2}=9.5 210+9=9.5
则我们可以以age是否小于等于9.5为划分规则,将数据集一分为二。

Notes:
1.CART(二叉树)用这种方法同时处理连续变量(预测值是划分后子数据集的均值)和离散变量;
2. C4.5连续变量用这种方式,离散变量用列的取值。

信息增益的计算:
CART Gain = Gini(父节点)- Gini(子节点)
ID3和C4.5 Gain = Entropy(父节点)- Entropy(子节点)

3. 如何停止迭代生长?

收敛条件:
(1)两轮迭代损失函数的差值小于某个值;
(2)限制最大迭代次数,也就是约束树最多生长几层

http://www.yayakq.cn/news/411403/

相关文章:

  • 那种投票网站里面怎么做做落地页的网站
  • 中国站长之家域名查询个人网页设计与制作模板教程
  • 化妆网站模板南昌做网站排名
  • 做网站 赚钱吗制作网页最多的图片格式
  • 推广网站的方法帮平台做推广怎么赚钱
  • 手机怎做网站二次开发软件
  • 如何使用阿里云建站做京挑客的网站有哪些
  • 国外网站域名 中国哪个杭州seo好
  • 为什么我自己做的网站搜索不到个人简历网免费模板
  • 珠海市网站建设哪家好php网站开发试卷
  • 一个服务器下怎么做两个网站可以建网站的软件
  • php培训网站源码什么项目必须走辽宁建设工程信息网
  • 网站建设费如何做账网站建设与管理课程实训
  • 小说网站做编辑常见的网站空间有哪些
  • 做亚马逊学英语有什么网站吗制做网站首先应该怎么做
  • wordpress全站链接制定一个网站建设方案
  • 如何提高网站访问速度的文章国外网站建设费用
  • 物流公司官方网站视频内容seo
  • 网站怎么设置支付功能android网站开发
  • 谷歌网站收录提交入口wordpress文字环绕图片
  • 建设网站制作实训报告在线文字logo设计
  • php 网站提速越南国家建设部网站
  • 网站开发要学的代码创意产品
  • 医疗网站备案wordpress打造
  • 网站建设yu深圳市西特塔网站建设工作室
  • 建网站的程序免费重庆做网站建设团队
  • 做网站多少钱googlethe word 和 wordpress
  • 如何查找网站根目录做百度推广网站找谁好
  • 设计网站公司长沙东莞长安网站建设
  • 河南省网站网页传奇游戏源码