假设检验(hypothesis testing)

这篇具有很好参考价值的文章主要介绍了假设检验(hypothesis testing)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

什么是假设检验

首先,什么是假设?在数理推断中,总体分布通常是未知的,包含了两类,一类是分布类型未知,一类是分布类型已知,但参数未知,假设就是对总体分布的一种推断,比如假设总体服从正态分布,假设正态分布的均值是500。根据未知类型,分为非参数假设和参数假设。假设检验就是利用样本来检验假设成立与否。接下来通过几个例子来介绍假设检验可以解决什么问题。
例子1:某洗衣粉加工机器要求每袋洗衣粉500g,现在随机抽9袋进行检查,发现其重量是:505、499、502、506、498、498、497、510、503,假设 σ = 2 \displaystyle \sigma =2 σ=2固定不变,问这个加工机器是否合格?
例子2:某工厂厂灯泡,产出的灯泡服从正态分布, N = ( u , 40000 ) \displaystyle N=( u,40000) N=(u,40000),平均寿命是1500小时,采用新工艺后,抽样25只,其平均寿命是 x ‾ = 1675 \displaystyle \overline{x} =1675 x=1675小时,问采用新工艺后,灯泡寿命是否显著挺高?

假设检验思想

下面通过一个例子来了解假设检验的基本思想。一个盒子装了红白球共100个,张三说里面有99个是白球,现在我任取一球,取出的是红球,问张三的说法对吗?
假如张三说的对,则p(红球)=1/100,也就是一次抽样取出红球是小概率事件,但现在一次抽样抽出红球,与小概率事件实际在一次抽样中不发生的原理矛盾,而矛盾的根源是假设张三说的对,所以要怀疑“张三的说法”,认为张三说的不对(这个认为不一定是对的)。当一次抽样是白球,没有发生矛盾,如果不能找到矛盾,那就没有理由怀疑“张三说得对”,也就是我们就不能怀疑“张三说的对”,那就认为张三是对的。这里实际上用到了反证法,先假定张三说的对,然后看有没有矛盾发生,如果矛盾发生则怀疑说法,如果没有矛盾则接受说法,认为说法正确。那跟谁矛盾呢?跟统计中的小概率实际不发生的原理矛盾。

假设检验步骤

接下来通过一个例子来介绍假设检验的步骤。
(1)提出假设。假设检验是对整体分布或者参数提出假设,并利用样本进行检验,所以我们首先提出假设。针对例子1:某洗衣粉加工机器要求每袋洗衣粉500g,现在随机抽9袋进行检查,发现其重量是:505、499、502、506、498、498、497、510、503,假设 σ = 2 \displaystyle \sigma =2 σ=2固定不变,问这个加工机器是否合格?我们提出原假设洗衣粉加工机器生产的洗衣粉整体分布的均值u=500g,即 H 0 : u = 500 \displaystyle H_{0} :u=500 H0:u=500,提出备择假设: H 1 : u ≠ 500 \displaystyle H_{1} :u\neq 500 H1:u=500
(2)假设 H 0 \displaystyle H_{0} H0成立,看看能不能推出矛盾。假设 H 0 \displaystyle H_{0} H0成立,则 X ∼ N ( 500 , 4 ) \displaystyle X\sim N( 500,4) XN(500,4),从这样的总体中抽9个样本,则样本的分布服从 X ‾ ∼ N ( 500 , 4 9 ) \displaystyle \overline{X} \sim N\left( 500,\frac{4}{9}\right) XN(500,94),标准化为 U = X ‾ − 500 2 / 3 ∼ N ( 0 , 1 ) \displaystyle U=\frac{\overline{X} -500}{2/3} \sim N( 0,1) U=2/3X500N(0,1)。 下图是标准正态分布的图像,中间非阴影部分是大概率事件,落在这个区间的概率是 1 − α \displaystyle 1-\alpha 1α,即 P { ∣ U ∣ < U α 2 } = 1 − α \displaystyle P\{|U|< U_{\frac{\alpha }{2}}\} =1-\alpha P{U<U2α}=1α
假设检验(hypothesis testing)
假设检验关注的是小概率事件发生了没,所以我们不看大概率事件,看落在阴影部分的小概率事件,即关注 P { ∣ U ∣ ⩾ U α 2 } = α \displaystyle P\{|U|\geqslant U_{\frac{\alpha }{2}}\} =\alpha P{UU2α}=α。在应用中,我们一般会先设定 α \displaystyle \alpha α的取值,也就是假定小概率事件发生的概率,当 α \displaystyle \alpha α和分布确定后,我们可以查表查看 α \displaystyle \alpha α对应的 U α 2 \displaystyle U_{\frac{\alpha }{2}} U2α对应的取值。比如我们取 α = 0.05 \displaystyle \alpha =0.05 α=0.05,可以通过查标准正态分布的表看到,当 α = 0.05 \displaystyle \alpha =0.05 α=0.05时,对应的 U α 2 = 1.96 \displaystyle U_{\frac{\alpha }{2}} =1.96 U2α=1.96,也就是当U小于 − 1.96 \displaystyle -1.96 1.96或者U大于1.96时,小概率事件发生了。接下来我们看抽样样本有没有落在小概率事件对应的区间: X ‾ = 1 9 ∑ i = 1 9 x i = 502 \displaystyle \overline{X} =\frac{1}{9}\sum _{i=1}^{9} x_{i} =502 X=91i=19xi=502 ∣ U ∣ = X ‾ − 500 2 / 3 = 3 > U α / 2 = 1.96 \displaystyle |U|=\frac{\overline{X} -500}{2/3} =3 >U_{\alpha /2} =1.96 U=2/3X500=3>Uα/2=1.96,样本数据落在小概率事件里头,与小概率事件在一次抽样中不发生的原理矛盾,而中间的推导没有问题,那矛盾的根源就是我们的假设是错误的,所以我们不得不怀疑原假设,也就是拒绝原假设,接受备择假设。假设|U|算出来算出来小于1.96,也就是没推出矛盾,那就没理由怀疑原假设,也就是接受原假设,认为原假设是对的。
这一步的基本思想就是从样本出发,去构造一个检验统计量T服从已知分布,这个统计量除了样本外,不含任何未知参数,例子中的检验统计量就是U。然后在 H 0 \displaystyle H_{0} H0成立的前提下,T的分布已知,构造一个检验法则,即想办法找出T的拒绝域和接受域。
这一步的基本思想就是从样本出发,去构造一个检验统计量T服从已知分布,这个统计量除了样本外,不含任何未知参数,例子中的检验统计量就是U。然后在 H 0 \displaystyle H_{0} H0成立的前提下,T的分布已知,构造一个检验法则,即想办法找到小概率事件对应的拒绝域和接受域。

假设检验存在的两类错误

我们提出假设,根据给出的样本来检验假设,得出接受 H 0 \displaystyle H_{0} H0还是拒绝 H 0 \displaystyle H_{0} H0的决策,这个决策未必是对的,原因是样本的随机性或者样本容量过小,导致判断错误,所以统计推断就会有不准确性,分为两类:
第一类错误:弃真。 H 0 \displaystyle H_{0} H0实际为真,但通过样本推断被拒绝了。 P { 拒绝 H 0 ∣ H 0 为真 } = α \displaystyle P\{拒绝H_{0} |H_{0} 为真\} =\alpha P{拒绝H0H0为真}=α
第二类错误:纳伪。 H 0 \displaystyle H_{0} H0实际为假,但通过样本推断被接受了。 P { 接受 H 0 ∣ H 0 为假 } = β \displaystyle P\{接受H_{0} |H_{0} 为假\} =\beta P{接受H0H0为假}=β
我们当然希望犯上面两类错误的概率越小越好,但要想同时让 α \displaystyle \alpha α β \displaystyle \beta β都很小,几乎是不可能的,除非样本容量N无限加大,我们选择在确保 α \displaystyle \alpha α的前提下再尽可能的减少 β \displaystyle \beta β,也就是优先保证第一类错误尽量不要犯。

假设检验方法

一个正态总体的参数假设检验

假设 X ∼ ( u , σ 2 ) \displaystyle X\sim \left( u,\sigma ^{2}\right) X(u,σ2) ( X 1 , X 2 , . . . , X n ) \displaystyle (X_{1} ,X_{2} ,...,X_{n}) (X1,X2,...,Xn)是取自X的样本,检验水平是 α \displaystyle \alpha α。正态分布有两个参数 u \displaystyle u u σ \displaystyle \sigma σ,我们分别看这两个参数的检验方法。
一、 u \displaystyle u u的假设检验
从形式上,可以提出三种不同的假设:
(1) H 0 : u = u 0 , H 1 : u ≠ u 0 \displaystyle H_{0} :u=u_{0} ,H_{1} :u\neq u_{0} H0u=u0H1u=u0,我们把这种称为双边假设,对应的检验叫双侧检验。
(2) H 0 : u ⩽ u 0 , H 1 : u > u 0 \displaystyle H_{0} :u\leqslant u_{0} ,H_{1} :u >u_{0} H0uu0H1u>u0,拒绝域在右边,所以我们把这种称为右假设,对应的检验叫右侧检验(单边检测)。
(3) H 0 : u ⩾ u 0 , H 1 : u < u 0 \displaystyle H_{0} :u\geqslant u_{0} ,H_{1} :u< u_{0} H0uu0H1u<u0,拒绝域在左边,所以我们把这种称为左假设,对应的检验叫左侧检验(单边检测)。
在具体解决的时候,经常把第(2)、(3)简化为 H 0 : u = u 0 \displaystyle H_{0} :u=u_{0} H0u=u0来处理,然后判断左右。所以下面的内容都只以形式(1)为例来对进行检验。
根据 σ \displaystyle \sigma σ是否已知,分为两种情况:
1、 当 σ 2 = σ 0 2 \displaystyle \sigma ^{2} =\sigma {_{0}}^{2} σ2=σ02已知,检验 H 0 : u = u 0 \displaystyle H_{0} :u=u_{0} H0u=u0
第一步:提出假设: H 0 : u = u 0 , H 1 : u ≠ u 0 \displaystyle H_{0} :u=u_{0} ,H_{1} :u\neq u_{0} H0u=u0H1u=u0
第二步:假定 H 0 \displaystyle H_{0} H0成立,可以得到 X ∼ ( u 0 , σ 0 2 ) \displaystyle X\sim \left( u_{0} ,\sigma {_{0}}^{2}\right) X(u0,σ02),选取检验统计量 U = X ‾ − u 0 σ 0 / n ∼ N ( 0 , 1 ) \displaystyle U=\frac{\overline{X} -u_{0}}{\sigma _{0} /\sqrt{n}} \sim N( 0,1) U=σ0/n Xu0N(0,1)
第三步:给定 α \displaystyle \alpha α,查表可得 P { ∣ U ∣ > U α 2 } = α \displaystyle P\{|U| >U_{\frac{\alpha }{2}}\} =\alpha P{U>U2α}=α对应 的 U α 2 \displaystyle U_{\frac{\alpha }{2}} U2α
第四步:计算 U \displaystyle U U的值,比较 ∣ U ∣ \displaystyle |U| U U α 2 \displaystyle U_{\frac{\alpha }{2}} U2α,下结论:
a. 若 ∣ U ∣ > U α 2 \displaystyle |U| >U_{\frac{\alpha }{2}} U>U2α,拒绝 H 0 \displaystyle H_{0} H0
b. 若 ∣ U ∣ < U α 2 \displaystyle |U|< U_{\frac{\alpha }{2}} U<U2α,接受 H 0 \displaystyle H_{0} H0
c. 若 ∣ U ∣ = U α 2 \displaystyle |U|=U_{\frac{\alpha }{2}} U=U2α,再抽样再检验
因为选取的统计量服从标准正态分布,所以这种检验方法叫U检验法

2、 σ 2 \displaystyle \sigma ^{2} σ2未知,检验 H 0 : u = u 0 \displaystyle H_{0} :u=u_{0} H0u=u0
第一步:提出假设: H 0 : u = u 0 , H 1 : u ≠ u 0 \displaystyle H_{0} :u=u_{0} ,H_{1} :u\neq u_{0} H0u=u0H1u=u0
第二步:假定 H 0 \displaystyle H_{0} H0成立,选取检验统计量。上面已知 σ 2 \displaystyle \sigma ^{2} σ2的时候,我们取 X ‾ − u 0 σ 0 / n \displaystyle \frac{\overline{X} -u_{0}}{\sigma _{0} /\sqrt{n}} σ0/n Xu0作为统计量,现在 σ 2 \displaystyle \sigma ^{2} σ2未知,我们使用样本方差 S \displaystyle S S来代替 σ \displaystyle \sigma σ,所以选取的统计量为 T = X ‾ − u 0 S / n ∼ t ( n − 1 ) \displaystyle T=\frac{\overline{X} -u_{0}}{S/\sqrt{n}} \sim t( n-1) T=S/n Xu0t(n1)(服从自由度为n-1的t分布)。t分布如下图:
假设检验(hypothesis testing)
第三步:给定 α \displaystyle \alpha α,查表可得 P { ∣ T ∣ > T α 2 } = α \displaystyle P\{|T| >T_{\frac{\alpha }{2}}\} =\alpha P{T>T2α}=α对应 的 T α 2 \displaystyle T_{\frac{\alpha }{2}} T2α
第四步:计算 T \displaystyle T T的值,比较 ∣ T ∣ \displaystyle |T| T T α 2 \displaystyle T_{\frac{\alpha }{2}} T2α,下结论:
a. 若 ∣ T ∣ > T α 2 \displaystyle |T| >T_{\frac{\alpha }{2}} T>T2α,拒绝 H 0 \displaystyle H_{0} H0
b. 若 ∣ T ∣ < T α 2 \displaystyle |T|< T_{\frac{\alpha }{2}} T<T2α,接受 H 0 \displaystyle H_{0} H0
c. 若 ∣ T ∣ = T α 2 \displaystyle |T|=T_{\frac{\alpha }{2}} T=T2α,再抽样再检验
因为选取的统计量服从T分布,所以这种检验方法叫T检验法

二、 σ 2 \displaystyle \sigma ^{2} σ2的假设检验
从形式上,可以提出三种不同的假设:
(1) H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 \displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} \neq \sigma {_{0}}^{2} H0σ2=σ02H1σ2=σ02
(2) H 0 : σ 2 ⩽ σ 0 2 , H 1 : σ 2 > σ 0 2 \displaystyle H_{0} :\sigma ^{2} \leqslant \sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} >\sigma {_{0}}^{2} H0σ2σ02H1σ2>σ02
(3) H 0 : σ 2 ⩾ σ 0 2 , H 1 : σ 2 < σ 0 2 \displaystyle H_{0} :\sigma ^{2} \geqslant \sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} < \sigma {_{0}}^{2} H0σ2σ02H1σ2<σ02
在具体解决的时候,经常把第(2)、(3)简化为 H 0 : σ 2 = σ 0 2 \displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} H0σ2=σ02来处理,然后判断左右,所以下面的内容都只以形式(1)为例来对进行检验。
根据 u \displaystyle u u是否已知,分为两种情况:
1、 u = u 0 \displaystyle u =u_{0} u=u0已知,检验 H 0 : σ 2 = σ 0 2 \displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} H0σ2=σ02
第一步:提出假设: H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 \displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} \neq \sigma {_{0}}^{2} H0σ2=σ02H1σ2=σ02
第二步:假定 H 0 \displaystyle H_{0} H0成立,选取检验统计量。若 H 0 \displaystyle H_{0} H0成立,可以得到 X ∼ ( u 0 , σ 0 2 ) \displaystyle X\sim \left( u_{0} ,\sigma {_{0}}^{2}\right) X(u0,σ02),从这样子的整体抽样得到的样本 X i \displaystyle X_{i} Xi X \displaystyle X X同分布,也就是抽样得到的样本 X i ∼ ( u 0 , σ 0 2 ) \displaystyle X_{i} \sim \left( u_{0} ,\sigma {_{0}}^{2}\right) Xi(u0,σ02) X i − u 0 σ 0 ∼ N ( 0 , 1 ) \displaystyle \frac{X_{i} -u_{0}}{\sigma _{0}} \sim N( 0,1) σ0Xiu0N(0,1)。我们现在要检验的是 σ 2 \displaystyle \sigma ^{2} σ2,所以对标准差进行平方,得到 ( X i − u 0 σ 0 ) 2 ∼ χ 2 ( 1 ) \displaystyle \left(\frac{X_{i} -u_{0}}{\sigma _{0}}\right)^{2} \sim \chi ^{2}( 1) (σ0Xiu0)2χ2(1)。n个样本相加,得到 ∑ i = 1 n ( X i − u 0 ) σ 0 2 2 ∼ χ 2 ( n ) \displaystyle \frac{\sum _{i=1}^{n}( X_{i} -u_{0})}{\sigma {_{0}}^{2}}^{2} \sim \chi ^{2}( n) σ02i=1n(Xiu0)2χ2(n)。所以这里我们选取统计量 χ 2 = ∑ i = 1 n ( X i − u 0 ) σ 0 2 2 ∼ χ 2 ( n ) \displaystyle \chi ^{2} =\frac{\sum _{i=1}^{n}( X_{i} -u_{0})}{\sigma {_{0}}^{2}}^{2} \sim \chi ^{2}( n) χ2=σ02i=1n(Xiu0)2χ2(n)。卡方分布图如下图:
假设检验(hypothesis testing)
第三步:给定 α \displaystyle \alpha α,差表可得 P { χ 2 > χ 2 α 2 ( n ) } = P { χ 2 < χ 2 1 − α 2 ( n ) } = α 2 \displaystyle P\left\{\chi ^{2} >\chi ^{2}{}_{\frac{\alpha }{2}}( n)\right\} =P\left\{\chi ^{2} < \chi ^{2}{}_{1-\frac{\alpha }{2}}( n)\right\} =\frac{\alpha }{2} P{χ2>χ22α(n)}=P{χ2<χ212α(n)}=2α对应 的 χ 2 α 2 ( n ) \displaystyle \chi ^{2}{}_{\frac{\alpha }{2}}( n) χ22α(n) χ 2 1 − α 2 ( n ) \displaystyle \chi ^{2}{}_{1-\frac{\alpha }{2}}( n) χ212α(n)
第四步:计算 χ 2 \displaystyle \chi ^{2} χ2的值,比较下结论。
因为选取的统计量服从卡方分布,所以这种检验方法叫卡方检验法

2、 u \displaystyle u u未已知,检验 H 0 : σ 2 = σ 0 2 \displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} H0σ2=σ02
第一步:提出假设: H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 \displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} \neq \sigma {_{0}}^{2} H0σ2=σ02H1σ2=σ02
第二步:假定 H 0 \displaystyle H_{0} H0成立,选取检验统计量。若 H 0 \displaystyle H_{0} H0成立,可以得到 X ∼ ( u , σ 0 2 ) \displaystyle X\sim \left( u ,\sigma {_{0}}^{2}\right) X(u,σ02),当 u \displaystyle u u已知的时候,我们使用统计量 ∑ i = 1 n ( X i − u 0 ) σ 0 2 2 \displaystyle \frac{\sum _{i=1}^{n}( X_{i} -u_{0})}{\sigma {_{0}}^{2}}^{2} σ02i=1n(Xiu0)2,现在 u \displaystyle u u未知,我们使用样本均值 X ‾ \displaystyle \overline{X} X来替代 u \displaystyle u u,得到统计量 χ 2 = ∑ i = 1 n ( X i − X ‾ ) σ 0 2 2 \displaystyle \chi ^{2} =\frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{\sigma {_{0}}^{2}}^{2} χ2=σ02i=1n(XiX)2,这个统计量服从什么分布呢?由公式 χ 2 = ( n − 1 ) S σ 2 ∼ χ 2 ( n − 1 ) \displaystyle \chi ^{2} =\frac{( n-1) S}{\sigma ^{2}} \sim \chi ^{2}( n-1) χ2=σ2(n1)Sχ2(n1) S = ∑ i = 1 n ( X i − X ‾ ) n − 1 \displaystyle S= \frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{n-1} S=n1i=1n(XiX),约掉n-1得到 ∑ i = 1 n ( X i − X ‾ ) σ 0 2 2 \displaystyle \frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{\sigma {_{0}}^{2}}^{2} σ02i=1n(XiX)2,所以这里选取的统计量是 χ 2 = ∑ i = 1 n ( X i − X ‾ ) σ 0 2 2 = ( n − 1 ) S σ 0 2 ∼ χ 2 ( n − 1 ) \displaystyle \chi ^{2} =\frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{\sigma {_{0}}^{2}}^{2} =\frac{( n-1) S}{\sigma {_{0}}^{2}} \sim \chi ^{2}( n-1) χ2=σ02i=1n(XiX)2=σ02(n1)Sχ2(n1)
第三步:给定 α \displaystyle \alpha α,差表可得 P { χ 2 > χ 2 α 2 ( n − 1 ) } = P { χ 2 < χ 2 1 − α 2 ( n − 1 ) } = α 2 \displaystyle P\left\{\chi ^{2} >\chi ^{2}{}_{\frac{\alpha }{2}}( n-1)\right\} =P\left\{\chi ^{2} < \chi ^{2}{}_{1-\frac{\alpha }{2}}( n-1)\right\} =\frac{\alpha }{2} P{χ2>χ22α(n1)}=P{χ2<χ212α(n1)}=2α对应 的 χ 2 α 2 ( n − 1 ) \displaystyle \chi ^{2}{}_{\frac{\alpha }{2}}( n-1) χ22α(n1) χ 2 1 − α 2 ( n − 1 ) \displaystyle \chi ^{2}{}_{1-\frac{\alpha }{2}}( n-1) χ212α(n1)
第四步:计算 χ 2 \displaystyle \chi ^{2} χ2的值,比较下结论。
因为选取的统计量服从卡方分布,所以这种检验方法叫卡方检验法

两个正态总体的参数假设检验

假设两个独立的正态总体X和Y, X ∼ ( u 1 , σ 1 2 ) \displaystyle X\sim \left( u_{1} ,\sigma {_{1}}^{2}\right) X(u1,σ12) ( X 1 , X 2 , . . . , X n ) \displaystyle (X_{1} ,X_{2} ,...,X_{n} ) X1,X2,...,Xn是取自X的样本, X ‾ \displaystyle \overline{X} X是样本均值,样本方差 S 1 2 \displaystyle S{_{1}}^{2} S12 Y ∼ ( u 2 , σ 2 2 ) \displaystyle Y\sim \left( u_{2} ,\sigma {_{2}}^{2}\right) Y(u2,σ22) ( Y 1 , Y 2 , . . . , Y n ) \displaystyle (Y_{1} ,Y_{2} ,...,Y_{n} ) Y1,Y2,...,Yn是取自 Y \displaystyle Y Y的样本, Y ‾ \displaystyle \overline{Y} Y是样本均值,样本方差 S 2 2 \displaystyle S{_{2}}^{2} S22

一、均值 u 1 \displaystyle u_{1} u1 u 2 \displaystyle u_{2} u2的差异性检验
从形式上,可以提出三种不同的假设:
(1) H 0 : u 1 = u 2 , H 1 : u 1 ≠ u 2 \displaystyle H_{0} :u_{1} =u_{2} ,H_{1} :u_{1} \neq u_{2} H0u1=u2H1u1=u2,我们把这种称为双边假设,对应的检验叫双侧检验。
(2) H 0 : u 1 ⩽ u 2 , H 1 : u 1 > u 2 \displaystyle H_{0} :u_{1} \leqslant u_{2} ,H_{1} :u_{1} >u_{2} H0u1u2H1u1>u2,拒绝域在右边,所以我们把这种称为右假设,对应的检验叫右侧检验(单边检测)。
(3) H 0 : u 1 ⩾ u 2 , H 1 : u 1 < u 2 \displaystyle H_{0} :u_{1} \geqslant u_{2} ,H_{1} :u_{1} < u_{2} H0u1u2H1u1<u2,拒绝域在左边,所以我们把这种称为左假设,对应的检验叫左侧检验(单边检测)。
根据 σ \displaystyle \sigma σ是否已知,分为两种情况:
1、当 σ 1 2 \displaystyle \sigma {_{1}}^{2} σ12 σ 2 2 \displaystyle \sigma {_{2}}^{2} σ22已知,检验 H 0 : u 1 = u 2 \displaystyle H_{0} :u_{1} =u_{2} H0u1=u2,以形式(1)为例来对进行检验:
第一步:提出假设: H 0 : u 1 = u 2 , H 1 : u 1 ≠ u 2 \displaystyle H_{0} :u_{1} =u_{2} ,H_{1} :u_{1} \neq u_{2} H0u1=u2H1u1=u2
第二步:假定 H 0 \displaystyle H_{0} H0成立,选取检验统计量。从独立的正态总体X和Y抽样可得新的分布 X ‾ − Y ‾ ∼ N ( u 1 − u 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \displaystyle \overline{X} -\overline{Y} \sim N\left( u_{1} -u_{2} ,\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}\right) XYN(u1u2,n1σ12+n2σ22),标准化为 U = X ‾ − Y ‾ − ( u 1 − u 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \displaystyle U=\frac{\overline{X} -\overline{Y} -(u_{1} -u_{2} )}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}} \sim N( 0,1) U=n1σ12+n2σ22 XYu1u2N(0,1)。选取检验统计量 U = X ‾ − Y ‾ − ( u 1 − u 2 ) σ 1 2 n 1 + σ 2 2 n 2 = X ‾ − Y ‾ σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \displaystyle U=\frac{\overline{X} -\overline{Y} -(u_{1} -u_{2} )}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}} =\frac{\overline{X} -\overline{Y}}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}} \sim N( 0,1) U=n1σ12+n2σ22 XYu1u2=n1σ12+n2σ22 XYN(0,1)
第三步:给定 α \displaystyle \alpha α,差表可得 P { ∣ U ∣ > U α 2 } = α \displaystyle P\{|U| >U_{\frac{\alpha }{2}}\} =\alpha P{U>U2α}=α对应 的 U α 2 \displaystyle U_{\frac{\alpha }{2}} U2α
第四步:计算 U \displaystyle U U的值,比较 ∣ U ∣ \displaystyle |U| U U α 2 \displaystyle U_{\frac{\alpha }{2}} U2α,下结论:
a. 若 ∣ U ∣ > U α 2 \displaystyle |U| >U_{\frac{\alpha }{2}} U>U2α,拒绝 H 0 \displaystyle H_{0} H0
b. 若 ∣ U ∣ < U α 2 \displaystyle |U|< U_{\frac{\alpha }{2}} U<U2α,接受 H 0 \displaystyle H_{0} H0
c. 若 ∣ U ∣ = U α 2 \displaystyle |U|=U_{\frac{\alpha }{2}} U=U2α,再抽样再检验
因为选取的统计量服从标准正态分布,所以这种检验方法叫U检验法

2、 当 σ 1 2 \displaystyle \sigma {_{1}}^{2} σ12 σ 2 2 \displaystyle \sigma {_{2}}^{2} σ22未知,但 σ 1 2 = σ 2 2 = σ 2 \displaystyle \sigma {_{1}}^{2} =\sigma {_{2}}^{2} =\sigma ^{2} σ12=σ22=σ2,检验 H 0 : u 1 = u 2 \displaystyle H_{0} :u_{1} =u_{2} H0u1=u2
第一步:提出假设: H 0 : u 1 = u 2 , H 1 : u 1 ≠ u 2 \displaystyle H_{0} :u_{1} =u_{2} ,H_{1} :u_{1} \neq u_{2} H0u1=u2H1u1=u2
第二步:假定 H 0 \displaystyle H_{0} H0成立,选取检验统计量。 ( n 1 − 1 ) S 1 2 σ 1 2 ∼ χ 2 \displaystyle \frac{( n_{1} -1) S{_{1}}^{2}}{\sigma {_{1}}^{2}} \sim \chi ^{2} σ12(n11)S12χ2 ( n 2 − 1 ) S 2 2 σ 2 2 ∼ χ 2 \displaystyle \frac{( n_{2} -1) S{_{2}}^{2}}{\sigma {_{2}}^{2}} \sim \chi ^{2} σ22(n21)S22χ2,当 σ 1 2 = σ 2 2 = σ 2 \displaystyle \sigma {_{1}}^{2} =\sigma {_{2}}^{2} =\sigma ^{2} σ12=σ22=σ2时, ( n 1 − 1 ) S 1 2 σ 2 + ( n 2 − 1 ) S 2 2 σ 2 ∼ χ 2 ( n 1 + n 2 − 2 ) \displaystyle \frac{( n_{1} -1) S{_{1}}^{2}}{\sigma ^{2}} +\frac{( n_{2} -1) S{_{2}}^{2}}{\sigma ^{2}} \sim \chi ^{2}( n_{1} +n_{2} -2) σ2(n11)S12+σ2(n21)S22χ2(n1+n22)。通过构造t分布我们可以把 σ 2 \displaystyle \sigma ^{2} σ2消掉, t = U ( n 1 − 1 ) S 1 2 σ 2 + ( n 2 − 1 ) S 2 2 σ 2 / ( n 1 + n 2 − 2 ) = X ‾ − Y ‾ − ( u 1 − u 2 ) σ 1 2 n 1 + σ 2 2 n 2 ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 σ 2 / ( n 1 + n 2 − 2 ) = X ‾ − Y ‾ ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 ⋅ 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \displaystyle t=\frac{U}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2}}{\sigma ^{2}} +\frac{( n_{2} -1) S{_{2}}^{2}}{\sigma ^{2}} /( n_{1} +n_{2} -2)}}=\frac{\frac{\overline{X} -\overline{Y} -(u_{1} -u_{2} )}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}}}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2} +( n_{2} -1) S{_{2}}^{2}}{\sigma ^{2}} /( n_{1} +n_{2} -2)}}=\frac{\overline{X} -\overline{Y}}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2} +( n_{2} -1) S{_{2}}^{2}}{n_{1} +n_{2} -2}} \cdot \sqrt{\frac{1}{n_{1}} +\frac{1}{n_{2}}}} \sim t( n_{1} +n_{2} -2) t=σ2(n11)S12+σ2(n21)S22/(n1+n22) U=σ2(n11)S12+(n21)S22/(n1+n22) n1σ12+n2σ22 XYu1u2=n1+n22(n11)S12+(n21)S22 n11+n21 XYt(n1+n22)
因此这里选取检验统计量 T = X ‾ − Y ‾ ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 ⋅ 1 n 1 + 1 n 2 \displaystyle T=\frac{\overline{X} -\overline{Y}}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2} +( n_{2} -1) S{_{2}}^{2}}{n_{1} +n_{2} -2}} \cdot \sqrt{\frac{1}{n_{1}} +\frac{1}{n_{2}}}} T=n1+n22(n11)S12+(n21)S22 n11+n21 XY ∼ t ( n 1 + n 2 − 2 ) \displaystyle \sim t( n_{1} +n_{2} -2) t(n1+n22)
第三步:给定 α \displaystyle \alpha α,差表可得 P { ∣ T ∣ > t α 2 } = α \displaystyle P\{|T| >t_{\frac{\alpha }{2}}\} =\alpha P{T>t2α}=α对应 的 t α 2 ( n 1 + n 2 − 2 ) \displaystyle t_{\frac{\alpha }{2}}( n_{1} +n_{2} -2) t2α(n1+n22)
第四步:计算 T \displaystyle T T的值,比较 ∣ T ∣ \displaystyle |T| T t α 2 \displaystyle t_{\frac{\alpha }{2}} t2α,下结论:
a. 若 ∣ T ∣ > t α 2 \displaystyle |T| >t_{\frac{\alpha }{2}} T>t2α,拒绝 H 0 \displaystyle H_{0} H0
b. 若 ∣ T ∣ < t α 2 \displaystyle |T|< t_{\frac{\alpha }{2}} T<t2α,接受 H 0 \displaystyle H_{0} H0
c. 若 ∣ T ∣ = t α 2 \displaystyle |T|=t_{\frac{\alpha }{2}} T=t2α,再抽样再检验
因为选取的统计量服从T分布,所以这种检验方法叫T检验法

二、方差 σ 1 2 \displaystyle \sigma {_{1}}^{2} σ12 σ 2 2 \displaystyle \sigma {_{2}}^{2} σ22的差异性检验
u 1 \displaystyle u_{1} u1 u 2 \displaystyle u_{2} u2未知,检验 H 0 : σ 1 2 = σ 2 2 \displaystyle H_{0} :\sigma {_{1}}^{2} =\sigma {_{2}}^{2} H0σ12=σ22
第一步:提出假设: H 0 : σ 1 2 = σ 2 2 , H 1 : σ 1 2 ≠ σ 2 2 \displaystyle H_{0} :\sigma {_{1}}^{2} =\sigma {_{2}}^{2} ,H_{1} :\sigma {_{1}}^{2} \neq \sigma {_{2}}^{2} H0σ12=σ22H1σ12=σ22
第二步:假定 H 0 \displaystyle H_{0} H0成立。取统计量 F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \displaystyle F=\frac{S{_{1}}^{2} /\sigma {_{1}}^{2}}{S{_{2}}^{2} /\sigma {_{2}}^{2}} \sim F( n_{1} -1,n_{2} -1) F=S22/σ22S12/σ12F(n11,n21),假设 σ 1 2 = σ 2 2 \displaystyle \sigma {_{1}}^{2} =\sigma {_{2}}^{2} σ12=σ22,则 F = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \displaystyle F=\frac{S{_{1}}^{2}}{S{_{2}}^{2}} \sim F( n_{1} -1,n_{2} -1) F=S22S12F(n11,n21)。F分布如下图:
假设检验(hypothesis testing)

第三步:给定 α \displaystyle \alpha α,差表可得 P { F > F α 2 ( n 1 − 1 , n 2 − 1 ) } = P { F < F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) } = α 2 \displaystyle P\{F >F_{\frac{\alpha }{2}}( n_{1} -1,n_{2} -1)\} =P\{F< F_{1-\frac{\alpha }{2}}( n_{1} -1,n_{2} -1)\} =\frac{\alpha }{2} P{F>F2α(n11,n21)}=P{F<F12α(n11,n21)}=2α 对应 的 F α 2 ( ( n 1 − 1 , n 2 − 1 ) \displaystyle F_{\frac{\alpha }{2}}(( n_{1} -1,n_{2} -1) F2α((n11,n21) F 1 − α 2 ( ( n 1 − 1 , n 2 − 1 ) \displaystyle F_{1-\frac{\alpha }{2}}(( n_{1} -1,n_{2} -1) F12α((n11,n21)
第四步:计算F的值,比较下结论。
因为选取的统计量服从F分布,所以这种检验方法叫F检验法文章来源地址https://www.toymoban.com/news/detail-502990.html

到了这里,关于假设检验(hypothesis testing)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 假设检验:如何理解单侧、双侧检验的拒绝域

            简单说就是:拒绝域与备择假设方向相同。假设检验就是一个证伪的过程,原假设和备择假设是一对\\\"相反的结论\\\"。\\\"拒绝域\\\",顾名思义,就是拒绝原假设的范围和方向,所以判断拒绝域在哪,可以直接看备择假设H1的条件是大于还是小于即可。 上述只是判断方法之一

    2024年02月03日
    浏览(47)
  • 数学建模.假设检验

    一.步骤 1.96为作用域,下面是作用域求法 在置信度为95%的情况下显然是不成立的,那么我们可以看看在置信度为99%的情况下结果如何呢 可以看到在置信度为99%的情况下是94斤是可以被认为偶然的误差,但是这个作用域不是很好计算,所以引用p值的方法,方法如下: 由此观之

    2024年01月21日
    浏览(47)
  • 数学建模-假设检验

    原假设,备择假设 P值,显著性水平 单侧建议,双侧检验

    2024年02月16日
    浏览(47)
  • 【统计】假设检验方法

    1. 不同检验方法 最小样本量 的确认 由统计量反推得到 2. 检验方法 方差齐性检验(F检验): 两个独立样本的方差差异检验,反映了平均值的代表性。方差齐次检验前提要近似正态分布。 正态性检验: 是否符合正态分布 似然比检验: 比较样本不同似然函数,检验其分布 参

    2024年02月05日
    浏览(49)
  • python统计(二)假设检验

    DescrStatsW.ztest_mean() statsmodels.stats.weightstats.DescrStatsW.ztest_mean(value=0, alternative=\\\'two-sided\\\') 参数 说明 value 假设的均值 alternative 备择假设的形式,可选值:‘two-sided’, ‘larger’, ‘smaller’ weightstats.ztest() statsmodels.stats.weightstats.ztest(x1, x2=None, value=0, alternative=\\\'two-sided\\\') 参数 说明

    2023年04月09日
    浏览(40)
  • 皮尔逊相关系数及假设检验

    一、看两者是否算相关要看两方面:显著水平以及相关系数 (1)显著水平,就是P值,这是首要的,因为如果不显著,相关系数再高也没用,可能只是因为偶然因素引起的,那么多少才算显著,一般p值小于0.05就是显著了;如果小于0.01就更显著;例如p值=0.001,就是很高的显著水平了,只要

    2024年02月08日
    浏览(50)
  • 数据的统计描述和分析——假设检验

    对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设. 1. 参数检验 :如果观测的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验

    2024年02月14日
    浏览(43)
  • 统计学下的假设检验

            由于本人才疏学浅,再加上时间仓促,难免有疏漏之处,恳请批评指正.         数理统计: 以概率论为基础,研究如何有效的去搜集、整理、分析带随机性影响的数据         总体与样本: 研究对象的全体就称为总体          样本: 假设需要测试某一个指标

    2024年02月04日
    浏览(44)
  • 统计基础:3.1_假设检验综述

      假设检验的思想和方法是根据小概率原理,具体地说当我们对问题提出原假设H0和备注假设H1,并要检验H0是否可信时,可以先假设H0是正确的,在此假设下,经过一次抽样,若发生小概率事件,可以根据“小概率事件在一次实验中几乎是不可能发生的”的理由,怀疑原假

    2024年02月11日
    浏览(39)
  • 使用Statsmodel进行假设检验和线性回归

    如果你使用 Python 处理数据,你可能听说过 statsmodel 库。Statsmodels 是一个 Python 模块,它提供各种统计模型和函数来探索、分析和可视化数据。该库广泛用于学术研究、金融和数据科学。在本文中,我们将介绍 statsmodel 库的基础知识、如何使用它以及它的好处。 Statsmodels 是一

    2024年02月02日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包