【机器学习】决策树-Gini指数

10月前作者：DonngZH 分类：Toy博客阅读(30) 违法举报

这篇具有很好参考价值的文章主要介绍了【机器学习】决策树-Gini指数。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1. CART树

分类回归树(CART,Classification And Regression Tree)算法是一种决策树分类方法。CART每一个节点上都采用二分法，采用一种二分递归分割的技术，CART生成的树必须是二叉树，也就是无论回归还是分类，无论特征离散还是连续，无论属性取值有多个还是两个，内部节点只能根据属性进行二分。因此，CART算法生成的决策树是结构简洁的二叉树。 CART算法既可以用分类任务，也可用于回归任务。

1-2 回归树

CART作为回归树：使用平方误差最小准则来选择特征并进行划分，也叫最小二乘回归树。对于特征j，找到j所有的划分点s，s将数据集分为c1、c2两部分，找出使得两部分的方差最小，同时整体方差最小的特征j以及划分点s。对于离散特征，采用均值或者中位数作为节点的输出结果。

1-3 分类树

CART作为分类树：使用Gini指数最小化准则来选择特征并进行划分。

1-4 终止条件

CART算法构建二叉树终止条件：

1、所有叶节点样本数为1，或属于同一类，或小于某一阈值；

2、树的高度到达某一阈值；

3、无剩余属性。

2. 基尼指与基尼指数

2-1 基尼值

基尼值可用来度量数据集的纯度，数据集D的基尼系数Gini(D)反映了从数据集D中随机抽取两个样本，其类别标记不一致的概率，因此Gini(D)越小，则数据集D的纯度越高。pk表示选中的样本属于k类别的概率，则这个样本被分错的概率是(1-pk)

gini系数决策树,人工智能,深度学习,机器学习,机器学习,决策树,人工智能

2-2 基尼指数

基尼指数（基尼不纯度）：表示在样本集合中一个随机选中的样本被分错的概率。
Gini指数越小表示集合中被选中的样本被分错的概率越小，也就是说集合的纯度越高，反之，集合越不纯。即 基尼指数（基尼不纯度）= 样本被选中的概率 * 样本被分错的概率。

gini系数决策树,人工智能,深度学习,机器学习,机器学习,决策树,人工智能

对于特征A，若其将数据集分为D1和D2两部分，则其基尼指数为：

gini系数决策树,人工智能,深度学习,机器学习,机器学习,决策树,人工智能

在候选集中，选择那个使得划分后基尼指数最小的属性作为最优的划分属性。

2-3 案例

1. 案例根据'有房者'、'婚姻'、'年收入'三个特征判断是否回拖欠贷款。
2. 根据gini指数构建cart分类树的过程如下：

3.总结

基尼系数也是一种衡量信息不确定性的方法，与信息熵计算出来的结果差距很小，基本可以忽略，但是基尼系数要计算快得多，因为没有对数。熵和基尼指数的关系如下图：

gini系数决策树,人工智能,深度学习,机器学习,机器学习,决策树,人工智能文章来源地址https://www.toymoban.com/news/detail-804240.html

Reference：
1. https://www.cnblogs.com/yuyingblogs/p/15319571.html

到了这里，关于【机器学习】决策树-Gini指数的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【人工智能】深度强化学习的新突破：如何打造智能决策系统

2024年02月06日
浏览(67)
机器学习入门教学——人工智能、机器学习、深度学习

1、人工智能人工智能相当于人类的代理人，我们现在所接触到的人工智能基本上都是弱AI，主要作用是正确解释从外部获得的数据，并对这些数据加以学习和利用，以便灵活的实现特定目标和任务。例如：阿尔法狗、智能汽车简单来说：人工智能使机器像人类一样进行感

2024年02月09日
浏览(91)
人工智能|机器学习——基于机器学习的舌苔检测

基于深度学习的舌苔检测毕设留档.zip资源-CSDN文库目前随着人们生活水平的不断提高，对于中医主张的理念越来越认可，对中医的需求也越来越多。在诊断中，中医通过观察人的舌头的舌质、苔质等舌象特征，了解人体内的体质信息从而对症下药。传统中医的舌诊主要依赖

2024年02月22日
浏览(70)
人工智能与机器人|机器学习

原文链接： https://mp.weixin.qq.com/s/PB_n8woxdsWPtrmL8BbehA 机器学习下包含神经网络、深度学习等，他们之间的关系表示如图2-7所示。图2-7 关系图那么什么是机器学习、深度学习、他们的区别又是什么呢？ 2.7.1 什么是机器学习？机器学习是人工智能 (AI) 和计算机科学的一个分支，

2024年02月06日
浏览(79)
人工智能与机器学习

欢迎关注博主 Mindtechnist 或加入【Linux C/C++/Python社区】一起探讨和分享Linux C/C++/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。专栏：《机器学习》 ☞什么是人工智能、机器学习、深度学习人工智能这个概念诞生于1956年的达特茅斯

2024年02月02日
浏览(63)
【机器学习】人工智能概述

🤵‍♂️ 个人主页：@艾派森的个人主页 ✍🏻作者简介：Python学习者 🐋 希望大家多多支持，我们一起进步！😄 如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 1.人工智能概述 1.1 机器学习、人工智能与深度学习 1.2 机器学习、深度学习能做些什么

2024年02月09日
浏览(55)
机器学习--人工智能概述

入门人工智能，了解人工智能是什么。为啥发展起来，用途是什么，是最重要也是最关键的事情。大致有以下思路。人工智能发展历程机器学习定义以及应用场景监督学习，无监督学习监督学习中的分类、回归特点知道机器学习的开发流程人工智能在现实生活中的应用

2024年01月19日
浏览(60)
人工智能、机器学习、深度学习的区别

人工智能涵盖范围最广，它包含了机器学习；而机器学习是人工智能的重要研究内容，它又包含了深度学习。人工智能是一门以计算机科学为基础，融合了数学、神经学、心理学、控制学等多个科目的交叉学科。人工智能是一门致力于使计算机能够模拟、模仿人类智能的学

2024年02月08日
浏览(56)
一探究竟：人工智能、机器学习、深度学习

1.1 人工智能是什么？ 1956年在美国Dartmounth 大学举办的一场研讨会中提出了人工智能这一概念。人工智能（Artificial Intelligence），简称AI，是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的

2024年02月17日
浏览(53)
12、人工智能、机器学习、深度学习的关系

很多年前听一个机器学习的公开课，在QA环节，一个同学问了老师一个问题“ 机器学习和深度学习是什么关系 ”？老师先没回答，而是反问了在场的同学，结果问了2-3个，没有人可以回答的很到位，我当时也是初学一脸懵，会场准备的小礼品也没有拿到。后来老师解释“机

2024年02月05日
浏览(72)