模型评估方法(AUC等)

10月前作者：lihonst 分类：Toy博客阅读(32) 违法举报

这篇具有很好参考价值的文章主要介绍了模型评估方法(AUC等)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1. 混合矩阵介绍

	预测1	预测0
实际1	TP	FN
实际0	FP	TN

TP (True Positive)：实际为正，预测为正。
FP（False Positive）:实际为负，预测为正。
TN (True Negative)：实际为负，预测为负。
FN (False Negative)：实际为正，预测为负。

2. 模型评估方法

2.1 准确度

$模型评估方法(AUC等)$

Accurray使用范围广，计算容易，但容易造假，即很容易训练一个准确较高的但用处不大的模型。如正样本90，负样本10个，直接把样本全部判正，则准确度90%，实际是没有意义的。

2.2. F1-score

精准率precision = TP / (TP + FP)，即被分类器判正的数据中正样本占比，对象是模型判定结果。用于判断是否有误判。
召回率recall = TP / (TP + FN)，即正样本数据中被模型判正的占比，对象是所有正样本数据。用于判断是否有漏判。

$模型评估方法(AUC等)$

F1-score计算的是precision和recall的调和平均数，综合考量了模型查全率和查准率的计算结果，结果更偏向于较小的那个。

2.3 ROC & AUC

定义两个概念：伪阳率FPR和真阳率TPR

伪阳率FPR = FP / (FP + TN)
真阳率TPR = TP / (TP + FN)

ROC（Receiver Operating Characteristic）曲线，即在二维平面画的曲线-ROC curve，横坐标为FPR（false positive ratio）,纵坐标为TPR。针对一个分类器，取不同的阈值，可以得到多组（FPR，TPR），即可绘制ROC曲线。由橙色曲线可知，曲线越靠近左上角，说明分类器效果越好；如果在对角线附近，则说明分类器接近随机猜测。

模型评估方法(AUC等)

AUC（Area under ROC curve）是ROC曲线的数值化表示，即曲线下的面积大小，通常取值范围为[0.5, 1]（如果在对角线下侧，则反向分析），值越大则表明分类器效果越好。

AUC = 1，是完美分类器，分类器不管选择哪个阈值均能完美分类。
0.5 < AUC < 1，优于随机猜测，分类器合理设置阈值，具有预测价值。
AUC = 0.5，随机猜测，分类没有预测价值。
AUC < 0.5，比随机猜测还差；但反预测而行，效果优于随机猜测。

建议值：AUC取值>0.7模型才有意义。

2.4 KS曲线

KS曲线即为KS值分布曲线，一般使用曲线最大值作为模型的评估结果，值越大，模型越具有区分能力。

<= 20,模型无区分能力
> 20 & <= 40, 模型具有一定的预测能力。
> 40 & <= 60, 模型预测能力较为突出。
> 60 & <= 75，模型预测能力非常突出。
> 75 模型预测能力难以置信，需要评估验证。

模型评估方法(AUC等)

KS和AUC区别，两者都是通过TPR和FPR计算，KS取的是TPR与FPR差值的最大值，对于分类器能够找到一个合理的阈值；而AUC没有指定如何划分使模型效果最好，只是评估了模型的整体训练效果。

2.5 均方根误差（RMSE）/标准误差

在介绍RMSE前先介绍一下均方误差（MSE），它是通过模型预测值和实际值之间的距离的平方来衡量模型的效果，预测值和实际值越接近则模型效果越好。计算公式如下：

模型评估方法(AUC等)

其中, N是训练集的个数，为每个训练集的真实输出，为模型对每个训练数据的预测结果。

而均方根误差也即标准差，是均方误差的算术平方根。引入标准差的目的是解决均方误差的结果和实际数据的量纲不同问题，则RMSE的公式如下：

模型评估方法(AUC等)

文章来源地址https://www.toymoban.com/news/detail-459236.html

到了这里，关于模型评估方法(AUC等)的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

深度学习之卷积神经网络中常用模型评估指标(混淆矩阵，精确率，召回率，特异度计算方法)——python代码

深度学习之卷积神经网络中常用模型评估指标(混淆矩阵，精确率，召回率，特异度计算方法)：混淆矩阵，精确率，召回率，特异度作为卷积神经网络的模型性能评价指标，它们的计算和绘制具有非常重要的意义，特别是在写论文的时候，我们往往需要这些指标来证明我们模

2024年02月06日
浏览(63)
强化学习9——免模型预测算法介绍（蒙特卡洛方法和时步差分方法）

对于大部分情况来说，环境是未知的，也就是说状态转移概率未知，对于这种情况的算法称为免模型预测算法。免模型算法与环境不断交互学习，但是需要大量的运算。蒙特卡罗方法通过重复随机抽选，之后运用统计概率此方法来从抽样结果中归纳我们想要得到的数值估计

2024年02月02日
浏览(47)
推荐系统离线评估方法和评估指标，以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。

📕我是廖志伟，一名Java开发工程师、Java领域优质创作者、CSDN博客专家、51CTO专家博主、阿里云专家博主、清华大学出版社签约作者、产品软文创造者、技术文章评审老师、问卷调查设计师、个人社区创始人、开源项目贡献者。🌎跑过十五公里、徒步爬过衡山、🔥有过三个

2024年02月08日
浏览(55)
迁移混合模型-基于新数据的迁移学习预测-寻找普通苹果与其他苹果

以已经训练好的模型A为起点，在新场景中，根据新数据建立模型B。目的：将某个领域或任务上学习到的知识或模式，应用到不同但相关的领域或问题中。英文：transfer learning 模型A存储了模型结构、权重系数（weights）模型B基于新数据，实现了对模型A的部分结构或权重系数

2024年01月24日
浏览(53)
【MATLAB第61期】基于MATLAB的GMM高斯混合模型回归数据预测

高斯混合模型GMM广泛应用于数据挖掘、模式识别、机器学习和统计分析。其中，它们的参数通常由最大似然和EM算法确定。关键思想是使用高斯混合模型对数据（包括输入和输出）的联合概率密度函数进行建模。文献参考：https://doi.org/10.1016/j.specom.2012.06.005。使用工具箱ne

2024年02月15日
浏览(46)
预测任务评价指标acc,auc

TP（true positive）：表示样本的真实类别为正，最后预测得到的结果也为正； FP（false positive）：表示样本的真实类别为负，最后预测得到的结果却为正； FN（false negative）：表示样本的真实类别为正，最后预测得到的结果却为负； TN（true negative）：表示样本的真实类别为负，

2024年02月01日
浏览(37)
成为AI产品经理——模型评估（混淆矩阵）

混淆矩阵有两个定义 positive（正例）和 negative（反例）。分别代表模型结果的好和坏。下图就是一个分类问题的混淆矩阵。横行代表真实的情况，而竖行代表预测的结果。为了便于理解，我在这里举一个分出瓜的好坏的分类问题。 TP： True Positive，真正例。表示这个瓜实际

2024年02月03日
浏览(62)
基于模型预测算法的混合储能微电网双层能量管理系统研究(Matlab代码实现）

💥💥💞💞 欢迎来到本博客 ❤️❤️💥💥 🏆博主优势： 🌞🌞🌞 博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️ 座右铭：行百里者，半于九十。 📋📋📋 本文目录如下： 🎁🎁🎁 目录 💥1 概述 📚2 运行结果 🌈3 Matlab代码+数据+文章讲解 🎉4 参考文

2024年02月13日
浏览(38)
多元分类预测 | Matlab麻雀算法(SSA)优化混合核极限学习机(HKELM)分类预测，多特征输入模型，SSA-HKELM分类预测

效果一览文章概述多元分类预测 | Matlab麻雀算法(SSA)优化混合核极限学习机(HKELM)分类预测，多特征输入模型，SSA-HKELM分类预测多特征输入单输出的二分类及多分类模型。程序内注释详细，直接替换数据就可以用。程序语言为matlab，程序可出分类效果图，迭代优化图，混淆矩

2024年02月12日
浏览(49)
多元分类预测 | Matlab鲸鱼算法(WOA)优化混合核极限学习机(HKELM)分类预测，多特征输入模型，WOA-HKELM分类预测

效果一览文章概述多元分类预测 | Matlab鲸鱼算法(WOA)优化混合核极限学习机(HKELM)分类预测，多特征输入模型，WOA-HKELM分类预测多特征输入单输出的二分类及多分类模型。程序内注释详细，直接替换数据就可以用。程序语言为matlab，程序可出分类效果图，迭代优化图，混淆矩

2024年02月12日
浏览(43)