机器学习基础知识之多模型性能对比评价方法

1年前作者：七层楼的疯子分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了机器学习基础知识之多模型性能对比评价方法。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

在进行预测或分类对比实验时，通常需要比较两个或两个以上的模型性能，因此，下面将介绍两个常用的多模型性能对比评价方法，一种是交叉验证t检验，该方法主要用于同一个数据集上两个模型的性能比较，另一种是Friedman检验与Nemenyi后续检验，这一方法主要用于同一组数据集上两个以上模型的性能比较。

1、交叉验证t检验

之前介绍过k折交叉验证方法，该方法将同一个数据集随机平均分成k份，然后让每一份依次作为测试数据集，余下数据作为训练数据集，使模型在训练数据集上训练后在测试数据集上进行测试以获得该模型在每份数据集上的误差，最后将误差值进行平均即为模型在此数据集上的最终误差值。而交叉验证t检验则是专门针对两个不同的模型在同一个数据集上进行k折交叉验证后的性能比较方法。
假设对于两个不同的模型A与模型B，在同一个数据集上进行k折交叉验证后得到的每份数据集上的误差分别如下：
机器学习基础知识之多模型性能对比评价方法

则需要将这两个模型在k份测试数据集上的误差进行一对一的比较，而当这两个模型的性能相同时，则这两个模型在同一份测试数据集上误差应该相同，即：
文章来源地址https://www.toymoban.com/news/detail-463740.html

到了这里，关于机器学习基础知识之多模型性能对比评价方法的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

李宏毅LLM——机器学习基础知识
机器学习 = 机器自动找出一种函数根据函数的不同，可以分为回归问题（输出数值）和分类问题（输出类别，选择题）生成有结构的物件，如图片、文句 ChatGPT是生成式学习，只不过是将生成式学习拆成多个分类问题来简化找出函式的三大步骤前置作业：决定需要什么样的
2024年01月20日
浏览(9)
深入理解机器学习——关联规则挖掘：基础知识
分类目录：《深入理解机器学习》总目录许多商业企业在日复一日的运营中积聚了大量的数据。例如，食品商店的收银台每天都收集大量的顾客购物数据。下图给出一个这种数据的例子，通常称作购物篮事务（Market Basket Transaction）。表中每一行对应一个事务，包含一个唯一
2024年02月10日
浏览(9)
一、机器学习前的数学基础知识
你说春天太短还未来得及看见自己就要粉碎成灯红酒绿的夏那就开花呀开他妈的 1.1 求和假设现在我们要在纸上写下1加到100的简单求和运算： 1 + 2 +3 + 4 + 5 + ........ + 99 + 100 使用求和符号简化（读作“西格玛”）：对于不明确要加到多少的情况：对集合使用求和符号：
2024年02月16日
浏览(12)
机器学习第一周：用卷积神经网络实现Mnist手写数字识别（付基础知识解释）
MNIST 数据集是一个手写数字识别数据集，包含了 60000 张训练图像和 10000 张测试图像，每张图像都是 28x28 像素的灰度图像。在这个代码中，我们首先使用了 numpy 库中的 np.random.seed() 方法来设置随机种子，以确保结果可重复。然后，我们使用了 Keras 中的 mnist.load_data() 方法来
2024年02月08日
浏览(10)
性能测试基础知识
什么是软件性能：软件性能是软件在执行特定任务或运行特定工作负载时的效率和表现力。主要集中于软件的响应效率、资源占用、数据处理速度、可靠性等方面。性能测试的概念：性能测试是一种软件测试方法。主要是测试系统、应用程序或者组件在特定的场景下的性
2024年02月09日
浏览(8)
性能测试必备基础知识(二)
除了空闲时间外的其他时间占总 CPU 时间的百分比，就是CPU 使用率，即 1- 空闲时间/CPU 总时间。当计算 CPU 使用率时，我们通常使用 /proc/stat 文件中的数据。该文件提供了有关 CPU 的计数器信息，包括各种状态下的节拍数。通过 cat /proc/stat 命令就可详细查看其信息，其中各
2024年02月05日
浏览(11)
性能测试必备基础知识(一)
平均负载是指单位时间内，系统处于可运行状态和不可中断状态的平均进程数，也就是平均活跃进程数，它和CPU使用率并没有直接关系。可运行状态的进程是指正在使用CPU或者等待CPU资源的进程。当我们使用类似于\\\"ps\\\"命令时，这些进程通常以\\\"R\\\"状态（Running或Runnable）显示。
2024年02月05日
浏览(15)
Elasticsearch 性能调优基础知识
Elastic Stack 已成为监控任何环境或应用程序的实际解决方案。从日志、指标和正常运行时间到性能监控甚至安全，Elastic Stack 已成为满足几乎所有监控需求的一体化解决方案。 Elasticsearch 通过提供强大的分析引擎来处理任何类型的数据，成为这方面的基石。 Elasticsearch 旨在处
2024年01月18日
浏览(9)
JVM-环境准备&性能指标&基础知识
环境准备性能指标基础知识环境准备 JDK — 工具 JDK（Java Development Kit）是用于开发 Java 应用程序的软件开发工具集合，包括了 Java 运行时的环境（JRE）、解释器（Java）、编译器（javac）、Java 归档（jar）、文档生成器（Javadoc）等工具。简单的说我们要开发 Java 程序，就需要
2024年02月07日
浏览(11)
YOLOv5基础知识点——性能指标
目标检测（object detection）=what + where Localization+Recongnition 类别标签（category label）置信度得分（confidence score）最小外接矩形（bounding box）定位是找到检测图像中带有一个给定标签的单个目标；检测是寻找到图像中带有给定标签的所有目标目标检测性能指标= 检测精度+检测速
2024年02月05日
浏览(14)