【机器学习】二分类问题中的混淆矩阵、准确率、召回率等 (Python代码实现)

这篇具有很好参考价值的文章主要介绍了【机器学习】二分类问题中的混淆矩阵、准确率、召回率等 (Python代码实现)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

混淆矩阵

混淆矩阵(Confusion Matrix):将分类问题按照真实情况与判别情况两个维度进行归类的一个矩阵,如在二分类问题中就是一个2*2的矩阵:
召回率 代码,机器学习与深度学习,分类,矩阵

  • TP(True Positive):表示实际为真预测为真
  • FP(False Positive):表示实际为假预测为真 (误报)
  • TN(True Negative):表示实际为假预测为假
  • FN(False Negative):表示实际为真预测为假(漏报)

召回率与准确率

召回率 = TP/(TP+FN)
准确率 = TP/(TP+FP)

一个池塘有10条鱼和20只小龙虾,渔夫打鱼,捞上8条鱼和12只龙虾,那么召回率为8/10=80%,准确率为8/(8+12)=40% —《Web安全之强化学习与GAN》

准确度Accuracy

准确度Acc是对检测结果的均衡评价,是全体预测正确按整个样本的比例:
准确度 = T P + T N T P + T N + F P + F N 准确度 = \frac{TP+TN}{TP+TN+FP+FN} 准确度=TP+TN+FP+FNTP+TN

sklearn代码示例

pip install scikit-learn==0.24.2文章来源地址https://www.toymoban.com/news/detail-820834.html

from sklearn import metrics # sklearn==0.24.2
import numpy as np

test_Y =    np.array([0,0,1,0,0,1,0,1,1,0]) # 测试集的标签
predict_Y = np.array([1,0,1,0,0,0,0,1,0,0]) # 预测值

confusion_matrix = metrics.confusion_matrix(test_Y,predict_Y)       # 混淆矩阵(注意与上面示例的混淆矩阵的图位置并不一一对应)
tn, fp, fn, tp = metrics.confusion_matrix(test_Y,predict_Y).ravel() # 混淆矩阵各值
recall_score = metrics.recall_score(test_Y,predict_Y)               # 召回率
pre_score = metrics.precision_score(test_Y,predict_Y)               # 准确率
ACC = metrics.accuracy_score(test_Y,predict_Y)                      # 准确度ACC

print(confusion_matrix)
print(tn, fp, fn, tp)
print(recall_score)
print(pre_score)
print(ACC)
[[5 1]
 [2 2]]
5 1 2 2
0.5
0.6666666666666666
0.7

到了这里,关于【机器学习】二分类问题中的混淆矩阵、准确率、召回率等 (Python代码实现)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【机器学习】准确率、精确度、召回率和 F1 定义

            数据科学家选择目标变量后 - 例如他们希望预测电子表格中的“列”,并完成了转换数据和构建模型的先决条件,最后步骤之一是评估模型的性能。         选择性能指标通常取决于要解决的业务问题。假设您的数据集中有 100 个示例,并且您已将每个示例输

    2024年02月12日
    浏览(33)
  • 药物 3D 打印新突破:圣地亚哥大学用机器学习筛选喷墨打印生物墨水,准确率高达 97.22%

    内容一览: 药物喷墨打印是一种高度灵活和智能化的制药方式。据相关报告统计,该领域市场规模将在不久的未来呈现指数级增长。过往,筛选合适生物墨水的方法费时且费力,因此也成为药物喷墨打印领域面临的主要挑战之一。为解决这一问题,国际药剂学期刊《Internat

    2024年02月10日
    浏览(44)
  • 音乐流派分类:探索利用Matlab,Django,JavaScript和Python实现85%准确率的机器学习方法

    音乐,这种涵盖了历史,文化,艺术和心理学的丰富多彩的媒体形式,一直以来都是人类社会生活的重要组成部分。通过时间的推移,音乐的风格和形式不断演变,形成了我们今天所熟知的各种音乐流派。音乐流派的分类,一直以来都是个颇具争议的主题,其主观性和模糊性

    2024年02月09日
    浏览(61)
  • 机器学习(四):4层BP神经网络(只用numpy不调包)用于训练鸢尾花数据集|准确率96%

    题目: 设计四层BP网络,以g(x)=sigmoid(x)为激活函数, 神经网络结构为:[4,10,6, 3],其中,输入层为4个节点,第一个隐含层神经元个数为10个节点;第二个隐含层神经元个数为6个节点,输出层为3个节点 利用训练数据iris-train.txt对BP神经网络分别进行训练,对训练后的模型统

    2023年04月08日
    浏览(26)
  • 机器学习 | 混淆矩阵和ROC曲线

    (1)对于二分类 TP(True Positive):将正类预测为正类数,真实为0,预测也为0 FN(False Negative):将正类预测为负类数,真实为0,预测为1 FP(False Positive):将负类预测为正类数, 真实为1,预测为0 TN(True Negative):将负类预测为负类数,真实为1,预测也为1 则混淆矩阵如下: (2)对

    2024年01月21日
    浏览(35)
  • 深度学习提高模型准确率方法

    我们已经收集好了一个数据集,建立了一个神经网络,并训练了模型,在测试和验证阶段最后得到的准确率不高不到90%。或者没有达到业务的期望(需要100%)。 下面列举一些提高模型性能指标的策略或技巧,来提高模型的准确率。 使用更多数据 最简单的方法就是增加数据集

    2024年02月03日
    浏览(35)
  • 自然语言处理学习笔记(八)———— 准确率

    目录 1.准确率定义 2.混淆矩阵与TP/FN/FP/TN 3. 精确率 4.召回率 5.F1值 6.中文分词的P、R、F1计算 7.实现 1.准确率定义         准确率是用来衡量一个系统的准确程度的值,可以理解为一系列评测指标。当预测与答案的数量相等时,准确率指的是系统做出正确判断的次数除以总

    2024年02月09日
    浏览(33)
  • 环境监测中的人工智能:提高数据质量与预测准确率的关键

    环境监测是现代社会中的一个重要领域,它涉及到对大气、水体、土壤、生物等环境因素的监测和分析,以支持政策制定、资源管理、环境保护等多方面的需求。随着大数据技术的发展,环境监测数据的规模和复杂性不断增加,这为环境监测提供了更多的信息和洞察力。然而

    2024年02月21日
    浏览(45)
  • 深度学习准确率提升之天花板分析

    OCR文字识别流水线主要分为三个模块:文字检测-字符分割-字符识别 训练完成后整个系统的准确率是72%,需要进一步提升准确率就需要单独分析每个模块的提升空间。 1)对于文件检测模块,把训练集的图像人工确保标注准确的文本位置来作为输入,系统准确率提升到89% 2)对

    2024年02月12日
    浏览(38)
  • 集成学习与模型融合:如何提高语音识别准确率

    语音识别技术是人工智能领域的一个重要研究方向,它涉及到自然语言处理、信号处理、机器学习等多个领域的知识。随着大数据时代的到来,语音识别技术的发展也受益于大量的数据和高性能计算资源的支持。然而,面对复杂多样的语音数据,传统的单模型方法已经不能满

    2024年02月20日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包