分类模型之混淆矩阵(Confusion Matrix)

这篇具有很好参考价值的文章主要介绍了分类模型之混淆矩阵(Confusion Matrix)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

混淆矩阵简介

混淆矩阵是ROC曲线绘制的基础，同时它也是衡量分类型模型准确度中最基本，最直观，计算最简单的方法。

可以简单理解为：将一个分类模型的预测结果与正确结果做对比，将预测正确的统计量和预测错误的统计量分别写入一张矩阵图中，得到的这张图就是混淆矩阵了。

混淆矩阵的使用情况：因为混淆矩阵是用来评判模型结果的，属于模型评估的一部分。因此，混淆矩阵多用于判断分类器（Classifier）的优劣，适用于分类型的数据模型有：分类树（Classification Tree）、逻辑回归（Logistic Regression）、线性判别分析（Linear Discriminant Analysis）等。

混淆矩阵及其参数

以分类中最简单的二分类为例，我们的模型训练完之后会进行“0”和“1”的判断，专业词语是positive和negative的判断。

我们通过样本可以直接知道真实情况下，哪些数据结果是positive，哪些结果是negative。同时，我们也可以通过神经网络或者其它模型跑出结果，进而可以知道模型认为这些数据哪些是positive，哪些是negative。

这样就能得到这样四个基础指标：

1、真实值是positive，模型认为是positive的数量（True Positive=TP）
2、真实值是positive，模型认为是negative的数量（False Negative=FN）：这就是统计学上的第二类错误（Type II Error）
3、真实值是negative，模型认为是positive的数量（False Positive=FP）：这就是统计学上的第一类错误（Type I Error）
4、真实值是negative，模型认为是negative的数量（True Negative=TN）

将这四个指标一起呈现在表格中，就能得到如下这样一个矩阵，我们称它为混淆矩阵（Confusion Matrix）：

分类模型之混淆矩阵(Confusion Matrix)

混淆矩阵的指标意义：

根据四个指标的含义，很容易看出TP和TN的值越大越好；FP和FN的值是越小越好了。

混淆矩阵的其他指标

根据以上四个基本指标，混淆矩阵还延申出了另外四个指标：

准确率（Accuracy）、精确率（Precision）、灵敏度（Sensitivity）、
特异度（Specificity）

四个参数的计算方式和意义如下便所示：
分类模型之混淆矩阵(Confusion Matrix)

参考：
https://blog.csdn.net/upupyon996deqing/article/details/124768166
https://blog.csdn.net/Orange_Spotty_Cat/article/details/80520839文章来源地址https://www.toymoban.com/news/detail-437322.html

到了这里，关于分类模型之混淆矩阵(Confusion Matrix)的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！