成为AI产品经理——模型评估(混淆矩阵)

这篇具有很好参考价值的文章主要介绍了成为AI产品经理——模型评估(混淆矩阵)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、混淆矩阵

1.混淆矩阵的介绍

混淆矩阵有两个定义positive(正例)negative(反例)。分别代表模型结果的好和坏。

下图就是一个分类问题的混淆矩阵。横行代表真实的情况,而竖行代表预测的结果。

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

为了便于理解,我在这里举一个分出瓜的好坏的分类问题。

TP:True Positive,真正例。表示这个瓜实际上是一个好瓜,预测出来的结果也是好瓜,所以它是一个真的好瓜,是一个真正例。预测结果正确。

FP:False Positive,假正例。表示这个瓜本身是一个坏瓜,预测结果却是一个好瓜,所以它是一个假的好瓜,是一个假正例。预测结果错误。

FN:False Negative,假反例。表示这个瓜本身是一个好瓜,预测结果是坏瓜,所以它是一个假的坏瓜,是一个假反例。预测结果错误。

TN:Truen Negative,真反例。表示这个瓜本身是一个坏瓜,预测结果也是一个坏瓜,所以它是一个真的坏瓜,是一个真反例。预测结果正确。

需要明确,明确T和F代表模型预测结果的对错,P和N代表模型预测出来的结果。

接下来,我们举个例子,便于我们学习混淆矩阵指标:准确率、精准率和召回率。

有100个瓜,实际上由40个好瓜,60个坏瓜。但是模型预测出来的结果为50个好瓜,50个坏瓜。在这50个好瓜里面,有30个预测对了,有20个预测错了。

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

此时预测的50个好瓜里面,30个预测对了,即真好瓜(TP);20个预测错了,即假好瓜。 所以TP = 30,FP = 20。 

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

 我们可以知道,40个好瓜=真的好瓜+预测错的坏瓜;60个坏瓜 = 真的坏瓜+假的好瓜。如下图:

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

根据以上式子,我们计算出了混淆矩阵所有的值。

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

根据以上条件,我们能够写出混淆矩阵。

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

我们期待的结果是预测结果和真实结果相一致,但是往往不太可能,所以我们需要评估的好坏,这里我们需要用到混淆矩阵的指标:准确率、精确率、召回率。 

2.准确率

准确率是预测准确的样本数在所有预测样本数的比例。在我们这里就是预测的真的好瓜和真的坏瓜在总瓜数的占比。

准确率的计算公式为:  成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

通过准确率我们可以看出模型的分类能力。

但是准确率的弊端是:如果在样本不均衡的情况下,占比大的对样本的影响比较大。

考虑一个极端的例子,其中有100个样本,其中99个属于类别A,1个属于类别B。如果一个模型将所有样本都预测为类别A,那么它的分子中,预测准确的A样本为99,预测准确的B样本为0,除以分母100。成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

准确率将是99%。尽管准确率很高,但模型对于类别B的预测几乎完全失败。所以这是不对的。

这种情况下,我们需要借助精准率(precision)。

3.精确率

精准率(precision),是用来计算模型预测的多准的指标,又名查准率。

精准率的计算公式为:成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

精确率关注的是在所有模型认为是正类别的样本中,有多大比例是真实的正类别。因此,精确率通常被解释为模型有多准确地"查准"了正类别,即模型有多能够确保它的正类别预测是准确的。

在一些应用中,比如垃圾邮件过滤,我们希望模型尽可能地准确地标识出正类别(即真正的垃圾邮件),同时避免将负类别(即正常邮件)错误地分类为正类别。在这种情况下,我们希望精确率尽可能高,以确保模型的正类别预测是可靠的。

3.召回率 

如果说精确度是模型预测的多准的指标,那么召回率就是模型广度的指标,又被称为查全率。

召回率的计算公式为:成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理 

公式表示需要分类的类别,在实际的该种类总数中,占比多少。好瓜在实际好瓜的总数是多少。所以召回率(查全率)是指模型在多大程度上能够预测出我需要的类别。

比如说:我有100个好瓜,你识别出50个,那么你的就在识别出我所需要的类别的能力就有50%。 

在实际的评估工作中,我们通常使用精确率和召回率来评估模型的效果。通过召回率看找到了多少我们想要找的好瓜,通过精确率来看我们找好瓜有多准。

召回率关注的是在实际为正类别的样本中,模型有多大程度地能够成功地识别出来。因此,召回率通常被解释为模型有多好地"查找"或"捕捉"了正类别,即模型有多能够找到所有实际存在的正类别样本。

在一些应用中,如医学诊断或欺诈检测,对于正类别的遗漏是不可接受的,因为这可能导致严重的后果。在这种情况下,我们希望模型的召回率尽可能高,以确保尽可能多地捕捉到所有真实的正类别。

由于精确率和召回率相互矛盾。模型如果想要查找的更准确,会减少识别的范围,所以精准率高,召回率低;反之,如果想要召回率高一点,那么精确率也会随之下降。

所以我们一般给算法同学提需求的时候会同时考虑。比如:30%的召回率下精准率提升5倍。

4.F1值

F1指标可以综合反映召回率和精准率,F1值越高,代表模型在精确率和召回率的综合表现越高

F1的计算公式:成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

5.总结 

准确率:比较容易理解,在样本不均衡的时候指标偏差过大。

精确率:模型预测的准确度。宁肯不预测,也不能预测错,秉持宁缺毋滥的原则。比如在刷脸支付的场景下,我们宁可检测不通过,而不能预测出错。

召回率:关注筛选的结果是不是全面的场景,秉持宁可错杀一千,也不放过一个的原则。

成为AI产品经理——模型评估(混淆矩阵),AI产品经理,人工智能,产品经理

PS:如果对于这几个指标还是不明白,推荐大家看这篇博文,讲的比较清晰。

准确率,精准率,召回率,真正率,假正率,ROC/AUC-CSDN博客

参考文献: 刘海丰——《成为AI产品经理》文章来源地址https://www.toymoban.com/news/detail-773211.html

到了这里,关于成为AI产品经理——模型评估(混淆矩阵)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 分类模型评估(混淆矩阵, precision, recall, f1-score)的原理和Python实现

    当我们已经获取到一个分类模型的预测值,可以通过不同指标来进行评估。 往往衡量二分类模型是基于以下的混淆矩阵概念: True Positive:真实值为正、预测值为正(真阳性) False Positive:真实值为负、预测值为正(假阳性) False Negative:真实值为正、预测值为负(假阴性)

    2024年02月04日
    浏览(35)
  • 【超详细】机器学习sklearn之分类模型评估 混淆矩阵、ROC曲线、召回率与精度、F1分数

    机器学习之分类模型的评估 学习分类模型评估的方法: 1、混淆矩阵 2、分类结果汇总 3、ROC曲线 4、召回率与精度 5、F1分数 一、评估分类器性能的度量 1、真正(true positive, TP)或f++,对应的是被分类模型正确预测的正样本数。 2、假负(false negative, FN)或f±对应的是被分类模型错

    2023年04月08日
    浏览(77)
  • 深度学习之卷积神经网络中常用模型评估指标(混淆矩阵,精确率,召回率,特异度计算方法)——python代码

    深度学习之卷积神经网络中常用模型评估指标(混淆矩阵,精确率,召回率,特异度计算方法): 混淆矩阵,精确率,召回率,特异度作为卷积神经网络的模型性能评价指标,它们的计算和绘制具有非常重要的意义,特别是在写论文的时候,我们往往需要这些指标来证明我们模

    2024年02月06日
    浏览(41)
  • 大学生毕业后想成为产品经理?那你得先从以下几个方面入手!

    产品经理,一个改变世界的职位:QQ、百度、微信、360·······这一个个改变世界的产品其背后都是响当当的产品经理:李彦宏、马化腾、张小龙、周鸿炜。他们在互联网世界里改变着人们的生活方式,也同时在改变着这世界的趋势。 尤其在这几年,随着移动互联网的发展

    2024年02月08日
    浏览(25)
  • 产品经理内容分享(六):AI产品经理需必备那些能力

    目录 必备的AI技术知识 第一章:AI产品经理是否需要懂技术及其程度 第二章:AI产品经理必备的AI技术基础知识——基础算法与机器学习方法 第三章:AI产品经理必须要懂的AI技术知识——场景应用 第四章:AI算法与模型的关系 第五章:AI产品经理如何学习技术知识 第六章:

    2024年02月19日
    浏览(48)
  • AI时代产品经理升级之道:ChatGPT让产品经理插上翅膀

    💂 个人网站:【工具大全】【游戏大全】【神级源码资源网】 🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】 💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 AI时代的产品经理面临着前所未有的机遇和挑战。随着人工智能技术的不断发展和

    2024年02月06日
    浏览(40)
  • AI产品经理-借力

    AI产品经理-借力:学会善用供应商改造自有产品 1.整个项目的工作方法 2. 项目启动 - 行业调研   3. 项目启动 - 供应商选型

    2024年02月03日
    浏览(38)
  • 混淆矩阵、精确率、召回率和F1值:如何评估分类器的性能?

    ❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈 (封面图由文心一格生成) 在机器学习中,分类是一项非常重要的任务。在

    2024年02月02日
    浏览(48)
  • 【ChatGPT】万字长文揭秘 GPT 背后:为何“大模型” 就一下子成为了引领人工智能 AI2.0时代热门技术?

    GPT (Generative Pre-trained Transformer) ,生成式预训练Transformer: 是一种基于 深度学习 的 自然语言处理模型 ,GPT 由 OpenAI 开发。 GPT 是一种基于 Transformer 模型的语言模型,可以通过大量的文本数据进行训练,从而学习到语言的规律和模式,进而生成自然流畅的语言文本。 本文将详

    2023年04月19日
    浏览(42)
  • 第一周:AI产品经理跳槽准备工作

    因素1:AI行业发展现状机会和未来 可以关注一些AI行业报告,这里我读了大概十来份报告,截取了一些关注点。 报告下载: 2023中国AI商业落地投资价值研究报告(63页):人工智能机会、价值评估和AI+行业场景分析、服务商案例、未来发展; 2. AI人才市场情况 报告下载:2

    2024年02月02日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包