成为AI产品经理——模型评估（混淆矩阵）

1年前作者：爱学习的时小糖分类：Toy博客阅读(5)违法举报

这篇具有很好参考价值的文章主要介绍了成为AI产品经理——模型评估（混淆矩阵）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、混淆矩阵

1.混淆矩阵的介绍

混淆矩阵有两个定义positive（正例）和negative（反例）。分别代表模型结果的好和坏。

下图就是一个分类问题的混淆矩阵。横行代表真实的情况，而竖行代表预测的结果。

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

为了便于理解，我在这里举一个分出瓜的好坏的分类问题。

TP：True Positive，真正例。表示这个瓜实际上是一个好瓜，预测出来的结果也是好瓜，所以它是一个真的好瓜，是一个真正例。预测结果正确。

FP：False Positive，假正例。表示这个瓜本身是一个坏瓜，预测结果却是一个好瓜，所以它是一个假的好瓜，是一个假正例。预测结果错误。

FN：False Negative，假反例。表示这个瓜本身是一个好瓜，预测结果是坏瓜，所以它是一个假的坏瓜，是一个假反例。预测结果错误。

TN：Truen Negative，真反例。表示这个瓜本身是一个坏瓜，预测结果也是一个坏瓜，所以它是一个真的坏瓜，是一个真反例。预测结果正确。

需要明确，明确T和F代表模型预测结果的对错，P和N代表模型预测出来的结果。

接下来，我们举个例子，便于我们学习混淆矩阵指标：准确率、精准率和召回率。

有100个瓜，实际上由40个好瓜，60个坏瓜。但是模型预测出来的结果为50个好瓜，50个坏瓜。在这50个好瓜里面，有30个预测对了，有20个预测错了。

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

此时预测的50个好瓜里面，30个预测对了，即真好瓜（TP）；20个预测错了，即假好瓜。所以TP = 30，FP = 20。

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

我们可以知道，40个好瓜=真的好瓜+预测错的坏瓜；60个坏瓜 = 真的坏瓜+假的好瓜。如下图：

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

根据以上式子，我们计算出了混淆矩阵所有的值。

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

根据以上条件，我们能够写出混淆矩阵。

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

我们期待的结果是预测结果和真实结果相一致，但是往往不太可能，所以我们需要评估的好坏，这里我们需要用到混淆矩阵的指标：准确率、精确率、召回率。

2.准确率

准确率是预测准确的样本数在所有预测样本数的比例。在我们这里就是预测的真的好瓜和真的坏瓜在总瓜数的占比。

准确率的计算公式为： $成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理$

通过准确率我们可以看出模型的分类能力。

但是准确率的弊端是：如果在样本不均衡的情况下，占比大的对样本的影响比较大。

考虑一个极端的例子，其中有100个样本，其中99个属于类别A，1个属于类别B。如果一个模型将所有样本都预测为类别A，那么它的分子中，预测准确的A样本为99，预测准确的B样本为0，除以分母100。 $成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理$

准确率将是99%。尽管准确率很高，但模型对于类别B的预测几乎完全失败。所以这是不对的。

这种情况下，我们需要借助精准率（precision）。

3.精确率

精准率（precision），是用来计算模型预测的多准的指标，又名查准率。

精准率的计算公式为： $成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理$

精确率关注的是在所有模型认为是正类别的样本中，有多大比例是真实的正类别。因此，精确率通常被解释为模型有多准确地"查准"了正类别，即模型有多能够确保它的正类别预测是准确的。

在一些应用中，比如垃圾邮件过滤，我们希望模型尽可能地准确地标识出正类别（即真正的垃圾邮件），同时避免将负类别（即正常邮件）错误地分类为正类别。在这种情况下，我们希望精确率尽可能高，以确保模型的正类别预测是可靠的。

3.召回率

如果说精确度是模型预测的多准的指标，那么召回率就是模型广度的指标，又被称为查全率。

召回率的计算公式为： $成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理$

公式表示需要分类的类别，在实际的该种类总数中，占比多少。好瓜在实际好瓜的总数是多少。所以召回率（查全率）是指模型在多大程度上能够预测出我需要的类别。

比如说：我有100个好瓜，你识别出50个，那么你的就在识别出我所需要的类别的能力就有50%。

在实际的评估工作中，我们通常使用精确率和召回率来评估模型的效果。通过召回率看找到了多少我们想要找的好瓜，通过精确率来看我们找好瓜有多准。

召回率关注的是在实际为正类别的样本中，模型有多大程度地能够成功地识别出来。因此，召回率通常被解释为模型有多好地"查找"或"捕捉"了正类别，即模型有多能够找到所有实际存在的正类别样本。

在一些应用中，如医学诊断或欺诈检测，对于正类别的遗漏是不可接受的，因为这可能导致严重的后果。在这种情况下，我们希望模型的召回率尽可能高，以确保尽可能多地捕捉到所有真实的正类别。

由于精确率和召回率相互矛盾。模型如果想要查找的更准确，会减少识别的范围，所以精准率高，召回率低；反之，如果想要召回率高一点，那么精确率也会随之下降。

所以我们一般给算法同学提需求的时候会同时考虑。比如：30%的召回率下精准率提升5倍。

4.F1值

F1指标可以综合反映召回率和精准率，F1值越高，代表模型在精确率和召回率的综合表现越高。

F1的计算公式： $成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理$

5.总结

准确率：比较容易理解，在样本不均衡的时候指标偏差过大。

精确率：模型预测的准确度。宁肯不预测，也不能预测错，秉持宁缺毋滥的原则。比如在刷脸支付的场景下，我们宁可检测不通过，而不能预测出错。

召回率：关注筛选的结果是不是全面的场景，秉持宁可错杀一千，也不放过一个的原则。

成为AI产品经理——模型评估（混淆矩阵）,AI产品经理,人工智能,产品经理

PS：如果对于这几个指标还是不明白，推荐大家看这篇博文，讲的比较清晰。

准确率，精准率，召回率，真正率，假正率，ROC/AUC-CSDN博客

参考文献：刘海丰——《成为AI产品经理》文章来源地址https://www.toymoban.com/news/detail-773211.html

到了这里，关于成为AI产品经理——模型评估（混淆矩阵）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

分类模型评估（混淆矩阵, precision, recall, f1-score）的原理和Python实现
当我们已经获取到一个分类模型的预测值，可以通过不同指标来进行评估。往往衡量二分类模型是基于以下的混淆矩阵概念： True Positive：真实值为正、预测值为正（真阳性） False Positive：真实值为负、预测值为正（假阳性） False Negative：真实值为正、预测值为负（假阴性）
2024年02月04日
浏览(7)
【超详细】机器学习sklearn之分类模型评估混淆矩阵、ROC曲线、召回率与精度、F1分数
机器学习之分类模型的评估学习分类模型评估的方法： 1、混淆矩阵 2、分类结果汇总 3、ROC曲线 4、召回率与精度 5、F1分数一、评估分类器性能的度量 1、真正(true positive, TP)或f++，对应的是被分类模型正确预测的正样本数。 2、假负(false negative, FN)或f±对应的是被分类模型错
2023年04月08日
浏览(10)
深度学习之卷积神经网络中常用模型评估指标(混淆矩阵，精确率，召回率，特异度计算方法)——python代码
深度学习之卷积神经网络中常用模型评估指标(混淆矩阵，精确率，召回率，特异度计算方法)：混淆矩阵，精确率，召回率，特异度作为卷积神经网络的模型性能评价指标，它们的计算和绘制具有非常重要的意义，特别是在写论文的时候，我们往往需要这些指标来证明我们模
2024年02月06日
浏览(11)
大学生毕业后想成为产品经理？那你得先从以下几个方面入手！
产品经理，一个改变世界的职位：QQ、百度、微信、360·······这一个个改变世界的产品其背后都是响当当的产品经理：李彦宏、马化腾、张小龙、周鸿炜。他们在互联网世界里改变着人们的生活方式，也同时在改变着这世界的趋势。尤其在这几年，随着移动互联网的发展
2024年02月08日
浏览(10)
产品经理内容分享(六)：AI产品经理需必备那些能力
目录必备的AI技术知识第一章：AI产品经理是否需要懂技术及其程度第二章：AI产品经理必备的AI技术基础知识——基础算法与机器学习方法第三章：AI产品经理必须要懂的AI技术知识——场景应用第四章：AI算法与模型的关系第五章：AI产品经理如何学习技术知识第六章：
2024年02月19日
浏览(9)
AI时代产品经理升级之道：ChatGPT让产品经理插上翅膀
💂 个人网站:【工具大全】【游戏大全】【神级源码资源网】 🤟 前端学习课程：👉【28个案例趣学前端】【400个JS面试题】 💅 寻找学习交流、摸鱼划水的小伙伴，请点击【摸鱼学习交流群】 AI时代的产品经理面临着前所未有的机遇和挑战。随着人工智能技术的不断发展和
2024年02月06日
浏览(9)
AI产品经理-借力
AI产品经理-借力：学会善用供应商改造自有产品 1.整个项目的工作方法 2. 项目启动 - 行业调研 3. 项目启动 - 供应商选型
2024年02月03日
浏览(11)
混淆矩阵、精确率、召回率和F1值：如何评估分类器的性能？
❤️觉得内容不错的话，欢迎点赞收藏加关注😊😊😊，后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）👈 （封面图由文心一格生成）在机器学习中，分类是一项非常重要的任务。在
2024年02月02日
浏览(9)
【ChatGPT】万字长文揭秘 GPT 背后：为何“大模型” 就一下子成为了引领人工智能 AI2.0时代热门技术？
GPT (Generative Pre-trained Transformer) ，生成式预训练Transformer：是一种基于深度学习的自然语言处理模型，GPT 由 OpenAI 开发。 GPT 是一种基于 Transformer 模型的语言模型，可以通过大量的文本数据进行训练，从而学习到语言的规律和模式，进而生成自然流畅的语言文本。本文将详
2023年04月19日
浏览(10)
第一周：AI产品经理跳槽准备工作
因素1：AI行业发展现状机会和未来可以关注一些AI行业报告，这里我读了大概十来份报告，截取了一些关注点。报告下载： 2023中国AI商业落地投资价值研究报告（63页）：人工智能机会、价值评估和AI+行业场景分析、服务商案例、未来发展； 2. AI人才市场情况报告下载：2
2024年02月02日
浏览(8)