笔记来源:通俗统计学原理入门5 假设检验 显著水平 significance level α 拒绝域 rejection region_哔哩哔哩_bilibili
目录
摘要
一、假设检验
二、显著水平、拒绝域和假设检验相关生活实例
1.显著水平和拒绝域
(1) 显著水平
(2) 拒绝域
2.实例应用
摘要
本文分别介绍了假设检验(Hypothesis Test)、显著性水平(Significance Level)和拒绝域(Rejection Region)
一、假设检验
我们接着知识点1的故事继续讲起,如果没有看过知识点1的小故事可以查看此专栏的知识点1中进行观看,相对清晰明了。
我们还是接着上一次的故事来讲。上一次,我们通过抽样统计,得出了大一5000名新生的高考英语平均分。现在一年时间过去了,大一新生变成了大二老生,学校里又来了新的大一新生。并且这时候,相关部门经过了一年的统计和整理,也公布了大二老生的高考英语成绩excel表。
但新问题又来了,我们想知道今年大一新生的高考英语平均分,与大二老生的平均分有没有显著差别。当然,相关部门此时肯定还没有整理出大一新生的成绩单,因此我们没有大一的excel成绩表,但我们手头现在有了大二老生的excel成绩表。我们该怎么办呢?
答案:这时可以进行假设。我们假设,大一新生和大二老生的平均成绩没有显著的差别。换句话说,大一和大二的英语成绩,属于同一个总体,总体的均值都是=137.41分。这样的话,我们若对大一新生进行大量反复的随机抽样的话,也将获得一个抽样分布,这个分布将和大二的抽样分布是一模一样的。
现在我们再来分析一下下图这个抽样分布。样本容量n=20,共抽了1000次样。其中,样本均值落入132分区间段的次数为0次,也可以说,有0%的概率落入132分区间段。样本均值落入133分区间段的次数为2次,也可以说,有千分之二,或0.2%的概率落入133分区间段。以此类推,1000次抽样中,样本均值有0.6%的概率落入134分区间段,7.6%的概率落入135分区间段,28.5%的概率落入137分区间段,1.1%的概率落入141分区间段,0.1%的概率落入142分区间段。
我们可以从上图看到,样本均值落入两边尖尖的尾巴区域的概率是非常低的。尾巴尖,代表着小概率的极端事件发生。那么,尾巴多尖才算尖呢?显然,频次越低,百分比越小,尾巴就越尖。频次一旦高于了某个数值,尾巴就变粗了。这个数值,也叫做临界值(critical value),是一个人为规定的数值。
例如,我们人为规定,从两边尾巴尖向中间对称轴的方向,数出5%的频次,才叫做"尖",或者叫"极端”(extreme)再往中间多数一点点,就超过5%了,就不算"极端"了。那么,两边尾巴5%,单边尾巴就是2.5%,如下图所示。
(1)现在,我们回到刚才的假设(如下图):假设大一和大二的英语成绩总体是一样的,都是(=137.41分的总体。我们在大一新生中,抽样一次,得到一个样本均分134分。134分,落入了阴影部分的"极端区域"。"极端"事件发生。说明了什么呢?
这说明,我们这个假设可能有问题。
在人为规定双边尾巴5%为极端的情形下,只抽样了一次,“极端"事件便发生了,我们便有理由去拒绝H0。拒绝了H0又怎么样呢,我们便转而去接受H0的对立面H1。H1的表述为:大一新生和大二老生的高考英语成绩有显著差别。H1也叫做对立假设、备择假设或Alternative Hypothesis。
所以,134分均分的这次抽样,让我们拒绝了H0,接受了H1,即,这次抽样,让我们认为"大一新生和大二老生的高考英语成绩有显著差别”。
(2)再假如,还是在同一个H0的假设下,我们抽样得到的均分不是134分,而是136分。136分是没有落入"极端区域"的,这说明,这个抽样是符合我们H0假设的预期的。所以,在人为规定双边尾巴5%为极端的情形下,抽样一次得到均值136分,符合"大一新生和大二老生的高考英语成绩没有显著差别”的假设,因此不能拒绝H0。
上面的表述有点啰嗦。我们简化一下说法,如下图。这个双边尾巴5%,也就是每一边2.5%的阈值,是人为规定的。这个阈值水平,叫做"显著性水平",英语叫significance level,记为α。a也可以是2%,1%甚至0.1%等等,这个要看具体案例的具体分析。
例如,假如这个大学的校长比较严格,觉得α=5%太宽松了,觉得大一大二的平均分差个3分还是比较常见的,觉得才差个3分就算极端情形实在是说不过去。后来校长就说,把α=0.05紧一紧,以后,α=0.01才算极端。
那么,还是这个H0,但现在α=0.01,即人为规定双边尾巴1%,也就是单边尾巴是0.5%的情形作为极端。这时,我们就需要重新划一下抽样分布中的临界值和阴影面积了。
二、显著水平、拒绝域和假设检验相关生活实例
1.显著水平和拒绝域
(1) 显著水平
我们简化一下说法。这个双边尾巴5%,也就是每一边2.5%的阈值,是人为规定的。这个阈值水平,叫做"显著性水平",英语叫significance level,记为α。a也可以是2%,1%甚至0.1%等等,这个要看具体案例的具体分析。
(2) 拒绝域
下图这个阴影部分的“极端区域",在假设检验中,也叫做“拒绝域"、“否定域"或"临界域"等。
英语里叫做rejection region。上述就是假设检验的基本思路。你可能觉得过于简单或者匪夷所思。
2.实例应用
例如:我们用今年1月份的消费水平抽样,和去年的已经统计出来的全年的消费水平总体进行比较,来预测今年和去年的消费有无显著差别。再例如:我们用A城市的一个平均工资抽样,和B城市的已经统计出来的工资总体进行比较,来推测两个城市工资水平有无显著差别。等等等等。文章来源:https://www.toymoban.com/news/detail-501523.html
文章来源地址https://www.toymoban.com/news/detail-501523.html
到了这里,关于知识点2 假设检验 显著水平和拒绝域的入门原理解释的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!