【统计理论】关于置信度、置信区间的理解

这篇具有很好参考价值的文章主要介绍了【统计理论】关于置信度、置信区间的理解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

太长不看(简要总结)

置信区间是估测总体参数的真值,这个值只有一个,且不会变动。例如做100次实验,100个成绩,95次实验的成绩区间包含总体均值,那么就代表置信度为95%。

随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低。(置信度与精度反方向变化)

这段是对参考资料的总结,下面基本摘自资源。

一、为什么要用区间估计?

首先,置信度这个概念的引入是为了配合一个叫做区间估计的东东。估算置信区间,通常都是用点估计算出来的数据加上一个变动幅度形成一个区间。在这个变动幅度里,涉及到一个参数就是置信度。

看个例子:你打枪打10次,你可以得到一个平均值,比如是8,那么我问你,总体的期望是不是就是8呢?你要说是,那就太草率了吧,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛?当然不是,总体的期望是客观存在不会变的。实际上样本均值等于总体期望的概率是0啊,所以说,以点估点是不准确的。

但是既然样本是从总体中抽出来的,那么样本的均值和总体的期望应该差的不远吧?你射击的均值是8,总体的期望总不能是1吧?所以,你若换句话说打枪的平均环数是[6,8],那么相信的人就会很多了。可见,虽然扩大了总体期望的取值范围,但是可信度明显高了。当然也不能简单无限度扩大区间范围,比如说打枪的平均环数是[1,10],那肯定百分之百可信了,毕竟统计也要讲究一定的精度,所以就有了置信度。也就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,说你测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了,听起来就靠谱的多。

二、平时我们常说的95%置信度到底是什么意思呢?

要理解置信度,就要理解好置信区间。要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是用样本估计总体。在统计学中,非常容易把概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。

但是这里有两个容易混淆的地方

1、真值指得是样本参数还是总体参数?这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。

2、95%的概率,变动的是谁?这里95%的概率,变动的是置信区间。

错误理解:假如有100个考生,100个学生中有95个考分落在(70,80)这个区间内。这就是95%置信度。这是非常错误的理解,样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值,这个值只有一个,且不会变动。

那正确的应该怎么理解呢?样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%。换言之,若扩大样本容量,考100次试,这100名学生的成绩组成的区间有95次包含了总体真正的均值,那这才是95%置信度。说白了,我们有95%的把握说总体的真值在这个区间内。

三、是不是置信度越高越好?

这个问题就要看你需要统计的是什么?经济效益是什么?通常情况下,95%被作为常用的置信度,原理就在于3西格玛控制(在一些严格的领域甚至会用到6西格玛),此时已经有很高的置信度了,那在往上去,随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低,精度与置信度相互的取舍则要全由分析者自行选择了。文章来源地址https://www.toymoban.com/news/detail-798133.html

参考资料

  • https://blog.csdn.net/yimingsilence/article/details/78084810

到了这里,关于【统计理论】关于置信度、置信区间的理解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • YOLOv5改进训练过程中置信度损失上升

            最近需要对yolov5网络框架进行改进,改进训练的过程当中发现了一个奇怪的问题。        从tensorboard的图像过程中看出,bbox_loss,cls_loss在训练预测之后正常下降,当时obj_loss置信度损失值在上升。这可把我给困住了,各方面都没有问题,困扰好久。       

    2024年02月08日
    浏览(47)
  • t分布95%的置信度,相关系数是多少的问题

    在概率论和统计学中,t-分布(t-distribution)用于根据 小样本 来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。 t分布95%的置信度,相关系数是 1.96 ,因为 t 分布于自由度有关,置信度对应下的

    2024年02月12日
    浏览(47)
  • YOLOv8 推理脚本--置信度保留多位浮点数 & 特征图可视化

    特征图可视化: 4位浮点数: 原始2位浮点数 4位浮点数 在进行改动前,请大家先阅读下 基础入门篇 | YOLOv8 项目【训练】【验证】【推理】最简单教程 | YOLOv8必看 | 最新更新,直接打印 FPS,mAP50,75,95 ,确保会用我给的推理脚本。 YOLO( ) :这里写你推理使用的

    2024年04月11日
    浏览(83)
  • 【海量数据挖掘/数据分析】 之 关联规则挖掘 Apriori 算法 (数据集、事务、频繁项集、关联规则、支持度、置信度)

    目录 【海量数据挖掘/数据分析】 之 关联规则挖掘 Apriori 算法 (数据集、事务、频繁项集、关联规则、支持度、置信度) 一、 关联规则挖掘简介 二、 数据集 与 事务 ( Transaction ) 概念 三、项 ( Item ) 概念 四、项集 ( Item Set ) 概念 五、频繁项集 六、数据集、事物、项、项集

    2024年02月05日
    浏览(66)
  • 数据关联规则:概述【频繁项集评估标准:支持度(support)、置信度(confidence)、提升度(lift)】【算法:Aprior、FP-Tree、GSP、CBA】

    关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,是数据挖掘的一个重要技术,用于从大量数据中挖掘出有价值的数据项之间的相关关系。 该过程通过发现顾客放人其购物篮中的不同商品之间的联系, 分析顾客的购买习惯 。通过了解哪些商品频

    2024年02月06日
    浏览(53)
  • 非参数统计:两样本和多样本的Brown-Mood中位数检验;Wilcoxon(Mann-Whitney)秩和检验及有关置信区间;Kruskal-Wallis秩和检验

    目录 两样本和多样本的Brown-Mood中位数检验 例3.1我国两个地区一些(分别为17个和15个)城镇职工的工资(元): Wilcoxon(Mann-Whitney)秩和检验及有关置信区间 例3.1我国两个地区一些(分别为17个和15个)城镇职工的工资(元): Kruskal-Wallis秩和检验 例4.1在一项健康实验中,三人组

    2023年04月25日
    浏览(45)
  • 概率论:计算置信区间

    置信区间是一种常用的区间估计方法,所谓 置信区间 就是分别以统计量的 置信上限 和 置信下限 为上下界构成的区间 。 显著性水平:α 置信度:1-α 或者 100(1-α)%  (例如,α=0.05,则置信度为0.95或95%) 置信区间的常用计算方法:Pr(c1=μ=c2)=1-α 置信区间:(c1, c2)

    2024年02月03日
    浏览(60)
  • 95%置信区间学习笔记

    1. 基本概念的理解 95%置信区间表示的意义为该区间能代表总体均值的概率为95%,而并非平均值的真值落在该区间的概率为95%(总体或者样本均值的真值是不会随外界条件发生变化的) 2.置信区间的计算公式 公式中的1.65, 1.96及2.58需要通过查表获得。需要注意,在总体数据集样

    2024年02月11日
    浏览(40)
  • 概率论第七章 参数估计 点估计、区间估计(置信区间)

     称为θ帽(θhat) 无偏估计量: 即:若θ的估计量的数学期望E()等于θ,则称θ的估计量是未知参数θ的无偏估计量。  题型:求数学期望 题型:证明A是B的无偏估计量  关键还是求数学期望。若E(A)=B,则称A是B的无偏估计量。 平方和拆成3项,第一项不变,后两项合并。 第一项

    2024年02月04日
    浏览(43)
  • 5.参数估计——点估计与区间估计概念,置信区间的公式求法与Python实现求出结果

    什么是点估计 设总体X的分布形式已知,但它的一个或多个参数未知,借助于总体X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题 注意: 点估计的问题就是要构造一个适当的统计量(估计量),用它的观察值作为未知参数的近似值(估计值) 估计量的评选

    2024年02月05日
    浏览(93)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包