当前位置: 首页 > news >正文

qq钓鱼网站在线生成器网站制作方案垂直领域获客

qq钓鱼网站在线生成器,网站制作方案垂直领域获客,互联网+创新创业项目计划书案例,老铁seo外链工具决策树与分类案例分析 文章目录 决策树与分类案例分析1. 认识决策树2. 分类3. 决策树的划分依据4. 决策树API5. 案例:鸢尾花分类6. 决策树可视化7. 总结 1. 认识决策树 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最…

决策树与分类案例分析

文章目录

  • 决策树与分类案例分析
    • 1. 认识决策树
    • 2. 分类
    • 3. 决策树的划分依据
    • 4. 决策树API
    • 5. 案例:鸢尾花分类
    • 6. 决策树可视化
    • 7. 总结

1. 认识决策树

决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。下面就来举一个例子:

在这里插入图片描述

通过这一个例子我们会有一个问题,为什么女生会把年龄放在第一个呢?这就是决策树的一个思想:高效性。

2. 分类

为了更好理解决策树是怎么分类的,我们给出一个例子:

在这里插入图片描述

现在我们有这些数据,请你根据这些数据,判断一个ID为16的人,是否能够贷款。我们现在要做的就是如何划分年龄、工作、房子、信贷这些数据。我们可以先看房子,再看工作…也可以先看工作,再看信贷…我们该如何选择来更高效的进行判断,所以我们引入信息熵、信息增益、条件熵、不确定性…

机器学习笔记02–决策树算法(手把手教你看懂)—信息熵,信息增益,增益率,基尼系数

计算过程这里就不演示了,直接出结果吧,我们以A·1,A2,A3,A4代表年龄、有工作、有自己的房子和贷款情况。最终计算的结果g(D,A1)=0.313,g(D,A2)=0.324,g(D,A3)=0.420,g(D,A4)=0.363,所以我们选择A3作为划分的第一个特征,这样我们就可以慢慢建立起一棵树。

3. 决策树的划分依据

决策树的原理不止信息增益这一种,还有其他方法。但是原理都类似,我们就不去举例计算了

  • ID3:信息增益,最大的准则
  • C4.5:信息增益比,最大的准则
  • CART
    • 分类树:基尼系数 最小的准则 再sklearn中可以选择划分的默认原则
    • 优势:划分更加细致

4. 决策树API

class sklearn.tree.DecisionTreeClassifier(criterion=‘gini’,max_depth=None,random_state=None)

  • 决策树分类器
  • criterion:默认是‘gini’系数,也可以选择信息增益的熵‘entropy’
  • max_depth:树的深度大小
  • random_state:随机数种子

5. 案例:鸢尾花分类

def decision_iris():"""决策数对鸢尾花进行分类:return:"""# 划分数据集iris = load_iris()# 划分数据集x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state= 22)# 决策树预估器estimator = DecisionTreeClassifier(criterion= "entropy")estimator.fit(x_train, y_train)# 模型评估y_predict = estimator.predict(x_test)print("y_predict:\n", y_predict)print("直接比对真实值和预测值:\n", y_test == y_predict)# 方法2:计算准确率score = estimator.score(x_test, y_test)print("准确率为:", score)return None
y_predict:[0 2 1 2 1 1 1 1 1 0 2 1 2 2 0 2 1 1 1 1 0 2 0 1 2 0 1 2 2 1 0 0 1 1 1 0 00]
直接比对真实值和预测值:[ True  True  True  True  True  True  True False  True  True  True  TrueTrue  True  True  True  True  True False  True  True  True  True  TrueTrue  True False  True  True False  True  True  True  True  True  TrueTrue  True]
准确率为: 0.8947368421052632

6. 决策树可视化

保存树的结构到dot文件

sklearn.tree.export_graphviz()

  • tree.export_graphviz(estimator,out_file=“./tree.dot”,feature_name=[“,”])
export_graphviz(estimator, out_file= "./tree.dot", feature_names= iris.feature_names)

生成了一个文件之后,我们需要把里面的文本导入到一个网站里面:http://webgraphviz.com/ 导入之后就成功了。

在这里插入图片描述

7. 总结

优点:

  • 简单的理解和解释,树木可视化

缺点:

  • 决策树学习者可以创建不能很好地推广数据的过于复杂的树,这被称为过拟合

改进:

  • 减枝cart算法
  • 随机森林
http://www.yayakq.cn/news/494615/

相关文章:

  • 网站建设品牌公司企业建立网站的必要性在于
  • 建设游戏运营网站开展工作总结企业宣传海报设计制作
  • 网站公司设计公司360免费建站方法
  • 自建购物网站建网站建设公司
  • 三合一网站搭建价格网站怎么做中英文交互
  • 如何建设公司门户网站免费网站空间怎么办
  • 网站后台乱码网站设计与建设实训
  • 网站视频与服务器的关系建设网站过水
  • 长沙长沙h5网站建设深圳龙华租房
  • 精准客户电话号码资源企业网站设计与优化
  • 广丰区建设局网站网站开发计划书模板
  • 湛江免费模板建站小红书推广引流软件
  • 微网站建设正规公司企业查查app下载
  • 微信淘宝购物券网站是怎么做的集约化网站群建设情况
  • 物流官网网站百度网址大全址大全
  • 网站首页的功能顺德网站建设jinqiye
  • 同城分类信息网站建设东莞模板网页制作
  • 个人建站如何赚钱wordpress备份 ftp
  • 余姚什么网站做装修比较好仿cnzz 网站 源码
  • 成都网站制作服务wordpress video.js
  • 网站制作公司费用邳州做网站pzwode
  • NET网站开发工程师网站招聘免费网站软件下载安装
  • 网站内容与模板设计网页设计流程25
  • 用别的域名给网站做竞价苏州网站建设联系电话
  • 山西省建设厅官方网站wordpress官方源文件结构
  • 网站授权协议东莞东城招聘网最新招聘
  • 企业网站建设457216336wordpress meta seo
  • 网站织梦后台怎么做建设网站的本质
  • 顺义手机网站设计甘肃省专业做网站
  • 如何替换网站的图片工作室起名大全免费取名