【Python机器学习】决策树——树的特征重要性-Toy模板网

这篇具有很好参考价值的文章主要介绍了【Python机器学习】决策树——树的特征重要性。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

利用一些有用的属性来总结树的工作原理，其中最常用的事特征重要性，它为每个特征树的决策的重要性进行排序。对于每个特征来说，它都是介于0到1之间的数字，其中0代表“根本没有用到”，1代表“完美预测目标值”。特征重要性的求和为1。

将特征重要性进行可视化：

import mglearn.datasets
import numpy as np
from sklearn.tree import DecisionTreeClassifier,export_graphviz
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer


def plot_importances(model):
    n_feature=cancer.data.shape[1]
    plt.barh(range(n_feature),model.feature_importances_,align='center')
    plt.yticks(np.arange(n_feature),cancer.feature_names)
    plt.xlabel('特征重要性')
    plt.ylabel('特征')

plt.rcParams['font.sans-serif'] = ['SimHei']

cancer=load_breast_cancer()
X_train,X_test,y_train,y_test=train_test_split(
    cancer.data,cancer.target,stratify=cancer.target,random_state=42
)
tree=DecisionTreeClassifier(max_depth=4,random_state=0)
tree.fit(X_train,y_train)

plot_importances(tree)
plt.show()

【Python机器学习】决策树——树的特征重要性,Python机器学习,机器学习,决策树,人工智能,python