知识点2 假设检验 显著水平和拒绝域的入门原理解释

这篇具有很好参考价值的文章主要介绍了知识点2 假设检验 显著水平和拒绝域的入门原理解释。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

笔记来源:通俗统计学原理入门5 假设检验 显著水平 significance level α 拒绝域 rejection region_哔哩哔哩_bilibili

目录

摘要

一、假设检验

二、显著水平、拒绝域和假设检验相关生活实例

1.显著水平和拒绝域

(1) 显著水平

(2) 拒绝域

2.实例应用


摘要

本文分别介绍了假设检验(Hypothesis Test)、显著性水平(Significance Level)和拒绝域(Rejection Region)

一、假设检验

我们接着知识点1的故事继续讲起,如果没有看过知识点1的小故事可以查看此专栏的知识点1中进行观看,相对清晰明了。

我们还是接着上一次的故事来讲。上一次,我们通过抽样统计,得出了大一5000名新生的高考英语平均分。现在一年时间过去了,大一新生变成了大二老生,学校里又来了新的大一新生。并且这时候,相关部门经过了一年的统计和整理,也公布了大二老生的高考英语成绩excel表

知识点2 假设检验 显著水平和拒绝域的入门原理解释

但新问题又来了,我们想知道今年大一新生的高考英语平均分,与大二老生的平均分有没有显著差别。当然,相关部门此时肯定还没有整理出大一新生的成绩单,因此我们没有大一的excel成绩表,但我们手头现在有了大二老生的excel成绩表。我们该怎么办呢?

答案:这时可以进行假设。我们假设,大一新生和大二老生的平均成绩没有显著的差别。换句话说,大一和大二的英语成绩,属于同一个总体,总体的均值都是=137.41分。这样的话,我们若对大一新生进行大量反复的随机抽样的话,也将获得一个抽样分布,这个分布将和大二的抽样分布是一模一样的。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

现在我们再来分析一下下图这个抽样分布。样本容量n=20,共抽了1000次样。其中,样本均值落入132分区间段的次数为0次,也可以说,有0%的概率落入132分区间段。样本均值落入133分区间段的次数为2次,也可以说,有千分之二,或0.2%的概率落入133分区间段。以此类推,1000次抽样中,样本均值有0.6%的概率落入134分区间段,7.6%的概率落入135分区间段,28.5%的概率落入137分区间段,1.1%的概率落入141分区间段,0.1%的概率落入142分区间段。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

我们可以从上图看到,样本均值落入两边尖尖的尾巴区域的概率是非常低的。尾巴尖,代表着小概率的极端事件发生。那么,尾巴多尖才算尖呢?显然,频次越低,百分比越小,尾巴就越尖。频次一旦高于了某个数值,尾巴就变粗了。这个数值,也叫做临界值(critical value),是一个人为规定的数值。

例如,我们人为规定,从两边尾巴尖向中间对称轴的方向,数出5%的频次,才叫做"尖",或者叫"极端”(extreme)再往中间多数一点点,就超过5%了,就不算"极端"了。那么,两边尾巴5%,单边尾巴就是2.5%,如下图所示。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

(1)现在,我们回到刚才的假设(如下图):假设大一和大二的英语成绩总体是一样的,都是(=137.41分的总体。我们在大一新生中,抽样一次,得到一个样本均分134分。134分,落入了阴影部分的"极端区域"。"极端"事件发生。说明了什么呢?
这说明,我们这个假设可能有问题。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

在人为规定双边尾巴5%为极端的情形下,只抽样了一次,“极端"事件便发生了,我们便有理由去拒绝H0。拒绝了H0又怎么样呢,我们便转而去接受H0的对立面H1H1的表述为:大一新生和大二老生的高考英语成绩有显著差别。H1也叫做对立假设、备择假设或Alternative Hypothesis。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

所以,134分均分的这次抽样,让我们拒绝了H0,接受了H1,即,这次抽样,让我们认为"大一新生和大二老生的高考英语成绩有显著差别”。 

(2)再假如,还是在同一个H0的假设下,我们抽样得到的均分不是134分,而是136分。136分是没有落入"极端区域"的,这说明,这个抽样是符合我们H0假设的预期的。所以,在人为规定双边尾巴5%为极端的情形下,抽样一次得到均值136分,符合"大一新生和大二老生的高考英语成绩没有显著差别”的假设,因此不能拒绝H0。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

上面的表述有点啰嗦。我们简化一下说法,如下图。这个双边尾巴5%,也就是每一边2.5%的阈值,是人为规定的。这个阈值水平,叫做"显著性水平",英语叫significance level,记为α。a也可以是2%,1%甚至0.1%等等,这个要看具体案例的具体分析。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

例如,假如这个大学的校长比较严格,觉得α=5%太宽松了,觉得大一大二的平均分差个3分还是比较常见的,觉得才差个3分就算极端情形实在是说不过去。后来校长就说,把α=0.05紧一紧,以后,α=0.01才算极端。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

那么,还是这个H0,但现在α=0.01,即人为规定双边尾巴1%,也就是单边尾巴是0.5%的情形作为极端。这时,我们就需要重新划一下抽样分布中的临界值和阴影面积了。 

二、显著水平、拒绝域和假设检验相关生活实例

1.显著水平和拒绝域

(1) 显著水平

我们简化一下说法。这个双边尾巴5%,也就是每一边2.5%的阈值,是人为规定的。这个阈值水平,叫做"显著性水平",英语叫significance level,记为α。a也可以是2%,1%甚至0.1%等等,这个要看具体案例的具体分析。

(2) 拒绝域

 下图这个阴影部分的“极端区域",在假设检验中,也叫做“拒绝域"、“否定域"或"临界域"等。
英语里叫做rejection region。上述就是假设检验的基本思路。你可能觉得过于简单或者匪夷所思。

知识点2 假设检验 显著水平和拒绝域的入门原理解释

2.实例应用

例如:我们用今年1月份的消费水平抽样,和去年的已经统计出来的全年的消费水平总体进行比较,来预测今年和去年的消费有无显著差别。再例如:我们用A城市的一个平均工资抽样,和B城市的已经统计出来的工资总体进行比较,来推测两个城市工资水平有无显著差别。等等等等。

知识点2 假设检验 显著水平和拒绝域的入门原理解释文章来源地址https://www.toymoban.com/news/detail-501523.html

到了这里,关于知识点2 假设检验 显著水平和拒绝域的入门原理解释的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【字节面试】Fail-fast知识点相关知识点

    字节面试,问到的一个小知识点,这里做一下总结,其实小编之前有一篇文章,已经对此有过涉及,不过这里知识专项针对于问题,把这个知识点拎出来说一下。 什么是Fail-fast机制? Hashmap是否拥有Fail-fast机制? ConcurrentModificationException异常原因和解决方法是什么? 哪些你常

    2024年01月22日
    浏览(35)
  • [知识点整理]中科院/国科大 自然语言处理nlp 期末考试知识点整理

    本文为2022秋网安学院的自然语言处理课程期末复习知识点整理,水平有限,整理的答案可能有错误或遗漏,欢迎大家指正。 文章的第二部分内容参考了学校学姐的文章,文章写的很好,大家可以关注她: (133条消息) 【一起入门NLP】中科院自然语言处理期末考试*总复习*:考

    2024年02月09日
    浏览(38)
  • 竞赛知识点4【搜索】

    栈是限定仅在表头进行插入和删除操作的线性表(先进后出)。 队列是只允许在表的前端(front)进行删除操作,而在表的后端(rear)进行插入操作。 树是一种数据结构,它是由 n ( n ≥ 1 ) n (ngeq1) n ( n ≥ 1 ) 个有限节点组成一个具有层次关系的集合。把它叫做 “树”是因为

    2024年02月02日
    浏览(24)
  • http相关知识点

    一张网页实际上可能会有多种元素组成,这也就说明了网页需要多次的http请求。 可由于http是基于TCP的,而TCP创建链接是有代价的,因此频繁的创建链接会导致效率降低 为了防止这种情况,就需要两端主机都具备支持长连接的功能,将大份的资源使用一条链接就包含,也就是

    2024年02月13日
    浏览(34)
  • Linux相关知识点

    Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。 Linux内核 是一个Linux系统的内核,而不是一个操作系统 Linux操作系统 红帽操

    2024年02月11日
    浏览(36)
  • 2023面试知识点一

    默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ( 该值可以通过参数 –XX:NewRatio 来指定 ),即:新生代 ( Young ) = 1/3 的堆空间大小。老年代 ( Old ) = 2/3 的堆空间大小。其中,新生代 ( Young ) 被细分为 Eden 和 两个 Survivor 区域,这两个 Survivor 区域分别被命名为 from 和 t

    2024年02月07日
    浏览(27)
  • FPGA基础知识点

    基础知识 逻辑值 逻辑0:表示低电平,也就是对应电路GND 逻辑1:表示高电平,也就是对应电路VCC 逻辑X:表示未知,有可能是高电平也有可能是低电平 逻辑Z:表示高阻态,外部没有激励信号,是一个悬空状态 数字进制格式 Verilog数字进制格式包括 二进制(b) , 八进制(

    2024年02月03日
    浏览(40)
  • ThreadLocal相关知识点

    ThreadLocal是Java中的一个类,它提供了一种线程局部变量的机制。它的作用是,为每个线程创建一个独立的变量副本,各个线程之间互不干扰。简单来说,ThreadLocal为多线程环境下的线程提供了一种线程私有的数据存储方式。 使用ThreadLocal可以避免多线程中的数据共享和竞争条

    2024年02月11日
    浏览(32)
  • Redis相关知识点

    Redis (REmote DIctionary Server) 是用 C 语言开发的一个开源的高性能键值对(key-value)数据库,它支持网络,可基于内存亦可持久化,并提供多种语言的API。Redis具有高效性、原子性、支持多种数据结构、持久化、高并发读写等特点。 特征: 1.数据间没有必然的关联关系 2.内部采用

    2024年01月23日
    浏览(55)
  • 柔性数组知识点

    什么是柔性数组?柔性数组其实也是动态内存管理部分的内容。这节主要来复习柔性数组的知识点。  当结构体的最后一个成员为数组, 且这个数组的大小未确定时, 我们就称它是柔性数组。 如: struct stu {         char name[20];         int age;         char adress[]; } 这里的

    2024年02月22日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包