前言
混淆矩阵是评判模型结果的一种指标,属于模型评估的一部分,常用于评判分类器模型的优劣。
Confusion Matrix
混淆矩阵常用于验证集中,横坐标True Labels对应真实类别,纵坐标Predicted Labels对应网络的预测类别。
对角线上的数值代表预测正确的样本个数。我们期望在网络预测过程中,尽可能将预测类别分布在对角线上。预测值在对角线上分布的越密集,就说明模型性能越好。并且通过混淆矩阵能看到网络对于哪些类别更容易分类出错,而且可以看到在哪些类别之间更容易出错。通过对混淆矩阵的进一步处理,可以进一步得到精确率(PPV)、召回率(TPR)、特异度(TNR) 三个指标。
注意:在往常的分类网络中只计算了准确率(Accuracy),这里的精确率是不一样的概念。
以二分类模型为例,每一列代表真实值标签,每一行代表预测值的标签。Positive对应正样本,Negative对应负样本。则有以下四种情况:
- 真实值=positive,预测值=positive (True Positive=TP)
- 真实值=positive,预测值=negative (False Negative=FN)统计学中的第二类错误“弃真”
- 真实值=negative,预测值=positive (False Positive=FP)统计学中的第一类错误“取伪”
- 真实值=negative,预测值=negative (True Negative=TN)
期望:TP和TN越大越好;FN和FP越小越好
文章来源:https://www.toymoban.com/news/detail-479211.html
编程实现
对花卉分类数据集使用MobileNetV2网络进行训练,在测试集上得到混淆矩阵结果如下:
文章来源地址https://www.toymoban.com/news/detail-479211.html
参考
- 分类模型评判指标(一) - 混淆矩阵(Confusion Matrix)
- 使用pytorch和tensorflow计算分类模型的混淆矩阵
到了这里,关于混淆矩阵(听课笔记)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!