统计学习方法第五章——决策树

这篇具有很好参考价值的文章主要介绍了统计学习方法第五章——决策树。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

x.1 决策树前言

decision tree决策树是一种分类和回归的方法，本章只考虑在分类领域的使用。决策树使用了归纳法划分特征空间，以此来达到分类的目的。决策树不同于KNN中的kd树，它是多叉树，不是二叉树。决策树是一种概率模型。

决策树采用了if-then规则，路径上的内部节点是对特征的分类，叶节点对应着规则的结论（即分类的结果）。

统计学习方法第五章——决策树

x.2 决策树学习算法

决策树的学习算法包括特征选择，决策树的生成与决策树的剪枝。其中核心要义是使用信息论的知识进行特征选择，决策树的生成就是使用了特征选择的方法更新下一节点（使用了特征增益是ID3算法，使用了特征增益比是C4.5算法），决策树的剪枝是为了避免过拟合的方法。

x.2.1 特征选择公式介绍

首先引入随机变量的entropy熵的定义，

统计学习方法第五章——决策树

entropy是用于表示随机变量不确定性的度量，当随机变量的entropy越小的时候，它就越规律，它的规律就越确定。当随机变量的取值等概率分布，即为均匀分布的时候，它的entropy就越大，随机变量就越不规律，它取那个值就越不确定，它的不确定性就越大， $entropy_{max}=\log_2 n$ 。entropy的取值范围如下：