什么是假设检验
首先,什么是假设?在数理推断中,总体分布通常是未知的,包含了两类,一类是分布类型未知,一类是分布类型已知,但参数未知,假设就是对总体分布的一种推断,比如假设总体服从正态分布,假设正态分布的均值是500。根据未知类型,分为非参数假设和参数假设。假设检验就是利用样本来检验假设成立与否。接下来通过几个例子来介绍假设检验可以解决什么问题。
例子1:某洗衣粉加工机器要求每袋洗衣粉500g,现在随机抽9袋进行检查,发现其重量是:505、499、502、506、498、498、497、510、503,假设
σ
=
2
\displaystyle \sigma =2
σ=2固定不变,问这个加工机器是否合格?
例子2:某工厂厂灯泡,产出的灯泡服从正态分布,
N
=
(
u
,
40000
)
\displaystyle N=( u,40000)
N=(u,40000),平均寿命是1500小时,采用新工艺后,抽样25只,其平均寿命是
x
‾
=
1675
\displaystyle \overline{x} =1675
x=1675小时,问采用新工艺后,灯泡寿命是否显著挺高?
假设检验思想
下面通过一个例子来了解假设检验的基本思想。一个盒子装了红白球共100个,张三说里面有99个是白球,现在我任取一球,取出的是红球,问张三的说法对吗?
假如张三说的对,则p(红球)=1/100,也就是一次抽样取出红球是小概率事件,但现在一次抽样抽出红球,与小概率事件实际在一次抽样中不发生的原理矛盾,而矛盾的根源是假设张三说的对,所以要怀疑“张三的说法”,认为张三说的不对(这个认为不一定是对的)。当一次抽样是白球,没有发生矛盾,如果不能找到矛盾,那就没有理由怀疑“张三说得对”,也就是我们就不能怀疑“张三说的对”,那就认为张三是对的。这里实际上用到了反证法,先假定张三说的对,然后看有没有矛盾发生,如果矛盾发生则怀疑说法,如果没有矛盾则接受说法,认为说法正确。那跟谁矛盾呢?跟统计中的小概率实际不发生的原理矛盾。
假设检验步骤
接下来通过一个例子来介绍假设检验的步骤。
(1)提出假设。假设检验是对整体分布或者参数提出假设,并利用样本进行检验,所以我们首先提出假设。针对例子1:某洗衣粉加工机器要求每袋洗衣粉500g,现在随机抽9袋进行检查,发现其重量是:505、499、502、506、498、498、497、510、503,假设
σ
=
2
\displaystyle \sigma =2
σ=2固定不变,问这个加工机器是否合格?我们提出原假设洗衣粉加工机器生产的洗衣粉整体分布的均值u=500g,即
H
0
:
u
=
500
\displaystyle H_{0} :u=500
H0:u=500,提出备择假设:
H
1
:
u
≠
500
\displaystyle H_{1} :u\neq 500
H1:u=500
(2)假设
H
0
\displaystyle H_{0}
H0成立,看看能不能推出矛盾。假设
H
0
\displaystyle H_{0}
H0成立,则
X
∼
N
(
500
,
4
)
\displaystyle X\sim N( 500,4)
X∼N(500,4),从这样的总体中抽9个样本,则样本的分布服从
X
‾
∼
N
(
500
,
4
9
)
\displaystyle \overline{X} \sim N\left( 500,\frac{4}{9}\right)
X∼N(500,94),标准化为
U
=
X
‾
−
500
2
/
3
∼
N
(
0
,
1
)
\displaystyle U=\frac{\overline{X} -500}{2/3} \sim N( 0,1)
U=2/3X−500∼N(0,1)。 下图是标准正态分布的图像,中间非阴影部分是大概率事件,落在这个区间的概率是
1
−
α
\displaystyle 1-\alpha
1−α,即
P
{
∣
U
∣
<
U
α
2
}
=
1
−
α
\displaystyle P\{|U|< U_{\frac{\alpha }{2}}\} =1-\alpha
P{∣U∣<U2α}=1−α。
假设检验关注的是小概率事件发生了没,所以我们不看大概率事件,看落在阴影部分的小概率事件,即关注
P
{
∣
U
∣
⩾
U
α
2
}
=
α
\displaystyle P\{|U|\geqslant U_{\frac{\alpha }{2}}\} =\alpha
P{∣U∣⩾U2α}=α。在应用中,我们一般会先设定
α
\displaystyle \alpha
α的取值,也就是假定小概率事件发生的概率,当
α
\displaystyle \alpha
α和分布确定后,我们可以查表查看
α
\displaystyle \alpha
α对应的
U
α
2
\displaystyle U_{\frac{\alpha }{2}}
U2α对应的取值。比如我们取
α
=
0.05
\displaystyle \alpha =0.05
α=0.05,可以通过查标准正态分布的表看到,当
α
=
0.05
\displaystyle \alpha =0.05
α=0.05时,对应的
U
α
2
=
1.96
\displaystyle U_{\frac{\alpha }{2}} =1.96
U2α=1.96,也就是当U小于
−
1.96
\displaystyle -1.96
−1.96或者U大于1.96时,小概率事件发生了。接下来我们看抽样样本有没有落在小概率事件对应的区间:
X
‾
=
1
9
∑
i
=
1
9
x
i
=
502
\displaystyle \overline{X} =\frac{1}{9}\sum _{i=1}^{9} x_{i} =502
X=91i=1∑9xi=502,
∣
U
∣
=
X
‾
−
500
2
/
3
=
3
>
U
α
/
2
=
1.96
\displaystyle |U|=\frac{\overline{X} -500}{2/3} =3 >U_{\alpha /2} =1.96
∣U∣=2/3X−500=3>Uα/2=1.96,样本数据落在小概率事件里头,与小概率事件在一次抽样中不发生的原理矛盾,而中间的推导没有问题,那矛盾的根源就是我们的假设是错误的,所以我们不得不怀疑原假设,也就是拒绝原假设,接受备择假设。假设|U|算出来算出来小于1.96,也就是没推出矛盾,那就没理由怀疑原假设,也就是接受原假设,认为原假设是对的。
这一步的基本思想就是从样本出发,去构造一个检验统计量T服从已知分布,这个统计量除了样本外,不含任何未知参数,例子中的检验统计量就是U。然后在
H
0
\displaystyle H_{0}
H0成立的前提下,T的分布已知,构造一个检验法则,即想办法找出T的拒绝域和接受域。
这一步的基本思想就是从样本出发,去构造一个检验统计量T服从已知分布,这个统计量除了样本外,不含任何未知参数,例子中的检验统计量就是U。然后在
H
0
\displaystyle H_{0}
H0成立的前提下,T的分布已知,构造一个检验法则,即想办法找到小概率事件对应的拒绝域和接受域。
假设检验存在的两类错误
我们提出假设,根据给出的样本来检验假设,得出接受
H
0
\displaystyle H_{0}
H0还是拒绝
H
0
\displaystyle H_{0}
H0的决策,这个决策未必是对的,原因是样本的随机性或者样本容量过小,导致判断错误,所以统计推断就会有不准确性,分为两类:
第一类错误:弃真。
H
0
\displaystyle H_{0}
H0实际为真,但通过样本推断被拒绝了。
P
{
拒绝
H
0
∣
H
0
为真
}
=
α
\displaystyle P\{拒绝H_{0} |H_{0} 为真\} =\alpha
P{拒绝H0∣H0为真}=α
第二类错误:纳伪。
H
0
\displaystyle H_{0}
H0实际为假,但通过样本推断被接受了。
P
{
接受
H
0
∣
H
0
为假
}
=
β
\displaystyle P\{接受H_{0} |H_{0} 为假\} =\beta
P{接受H0∣H0为假}=β
我们当然希望犯上面两类错误的概率越小越好,但要想同时让
α
\displaystyle \alpha
α和
β
\displaystyle \beta
β都很小,几乎是不可能的,除非样本容量N无限加大,我们选择在确保
α
\displaystyle \alpha
α的前提下再尽可能的减少
β
\displaystyle \beta
β,也就是优先保证第一类错误尽量不要犯。
假设检验方法
一个正态总体的参数假设检验
假设
X
∼
(
u
,
σ
2
)
\displaystyle X\sim \left( u,\sigma ^{2}\right)
X∼(u,σ2),
(
X
1
,
X
2
,
.
.
.
,
X
n
)
\displaystyle (X_{1} ,X_{2} ,...,X_{n})
(X1,X2,...,Xn)是取自X的样本,检验水平是
α
\displaystyle \alpha
α。正态分布有两个参数
u
\displaystyle u
u和
σ
\displaystyle \sigma
σ,我们分别看这两个参数的检验方法。
一、
u
\displaystyle u
u的假设检验
从形式上,可以提出三种不同的假设:
(1)
H
0
:
u
=
u
0
,
H
1
:
u
≠
u
0
\displaystyle H_{0} :u=u_{0} ,H_{1} :u\neq u_{0}
H0:u=u0,H1:u=u0,我们把这种称为双边假设,对应的检验叫双侧检验。
(2)
H
0
:
u
⩽
u
0
,
H
1
:
u
>
u
0
\displaystyle H_{0} :u\leqslant u_{0} ,H_{1} :u >u_{0}
H0:u⩽u0,H1:u>u0,拒绝域在右边,所以我们把这种称为右假设,对应的检验叫右侧检验(单边检测)。
(3)
H
0
:
u
⩾
u
0
,
H
1
:
u
<
u
0
\displaystyle H_{0} :u\geqslant u_{0} ,H_{1} :u< u_{0}
H0:u⩾u0,H1:u<u0,拒绝域在左边,所以我们把这种称为左假设,对应的检验叫左侧检验(单边检测)。
在具体解决的时候,经常把第(2)、(3)简化为
H
0
:
u
=
u
0
\displaystyle H_{0} :u=u_{0}
H0:u=u0来处理,然后判断左右。所以下面的内容都只以形式(1)为例来对进行检验。
根据
σ
\displaystyle \sigma
σ是否已知,分为两种情况:
1、 当
σ
2
=
σ
0
2
\displaystyle \sigma ^{2} =\sigma {_{0}}^{2}
σ2=σ02已知,检验
H
0
:
u
=
u
0
\displaystyle H_{0} :u=u_{0}
H0:u=u0:
第一步:提出假设:
H
0
:
u
=
u
0
,
H
1
:
u
≠
u
0
\displaystyle H_{0} :u=u_{0} ,H_{1} :u\neq u_{0}
H0:u=u0,H1:u=u0
第二步:假定
H
0
\displaystyle H_{0}
H0成立,可以得到
X
∼
(
u
0
,
σ
0
2
)
\displaystyle X\sim \left( u_{0} ,\sigma {_{0}}^{2}\right)
X∼(u0,σ02),选取检验统计量
U
=
X
‾
−
u
0
σ
0
/
n
∼
N
(
0
,
1
)
\displaystyle U=\frac{\overline{X} -u_{0}}{\sigma _{0} /\sqrt{n}} \sim N( 0,1)
U=σ0/nX−u0∼N(0,1)
第三步:给定
α
\displaystyle \alpha
α,查表可得
P
{
∣
U
∣
>
U
α
2
}
=
α
\displaystyle P\{|U| >U_{\frac{\alpha }{2}}\} =\alpha
P{∣U∣>U2α}=α对应 的
U
α
2
\displaystyle U_{\frac{\alpha }{2}}
U2α
第四步:计算
U
\displaystyle U
U的值,比较
∣
U
∣
\displaystyle |U|
∣U∣和
U
α
2
\displaystyle U_{\frac{\alpha }{2}}
U2α,下结论:
a. 若
∣
U
∣
>
U
α
2
\displaystyle |U| >U_{\frac{\alpha }{2}}
∣U∣>U2α,拒绝
H
0
\displaystyle H_{0}
H0
b. 若
∣
U
∣
<
U
α
2
\displaystyle |U|< U_{\frac{\alpha }{2}}
∣U∣<U2α,接受
H
0
\displaystyle H_{0}
H0
c. 若
∣
U
∣
=
U
α
2
\displaystyle |U|=U_{\frac{\alpha }{2}}
∣U∣=U2α,再抽样再检验
因为选取的统计量服从标准正态分布,所以这种检验方法叫U检验法 。
2、
σ
2
\displaystyle \sigma ^{2}
σ2未知,检验
H
0
:
u
=
u
0
\displaystyle H_{0} :u=u_{0}
H0:u=u0:
第一步:提出假设:
H
0
:
u
=
u
0
,
H
1
:
u
≠
u
0
\displaystyle H_{0} :u=u_{0} ,H_{1} :u\neq u_{0}
H0:u=u0,H1:u=u0
第二步:假定
H
0
\displaystyle H_{0}
H0成立,选取检验统计量。上面已知
σ
2
\displaystyle \sigma ^{2}
σ2的时候,我们取
X
‾
−
u
0
σ
0
/
n
\displaystyle \frac{\overline{X} -u_{0}}{\sigma _{0} /\sqrt{n}}
σ0/nX−u0作为统计量,现在
σ
2
\displaystyle \sigma ^{2}
σ2未知,我们使用样本方差
S
\displaystyle S
S来代替
σ
\displaystyle \sigma
σ,所以选取的统计量为
T
=
X
‾
−
u
0
S
/
n
∼
t
(
n
−
1
)
\displaystyle T=\frac{\overline{X} -u_{0}}{S/\sqrt{n}} \sim t( n-1)
T=S/nX−u0∼t(n−1)(服从自由度为n-1的t分布)。t分布如下图:
第三步:给定
α
\displaystyle \alpha
α,查表可得
P
{
∣
T
∣
>
T
α
2
}
=
α
\displaystyle P\{|T| >T_{\frac{\alpha }{2}}\} =\alpha
P{∣T∣>T2α}=α对应 的
T
α
2
\displaystyle T_{\frac{\alpha }{2}}
T2α
第四步:计算
T
\displaystyle T
T的值,比较
∣
T
∣
\displaystyle |T|
∣T∣和
T
α
2
\displaystyle T_{\frac{\alpha }{2}}
T2α,下结论:
a. 若
∣
T
∣
>
T
α
2
\displaystyle |T| >T_{\frac{\alpha }{2}}
∣T∣>T2α,拒绝
H
0
\displaystyle H_{0}
H0
b. 若
∣
T
∣
<
T
α
2
\displaystyle |T|< T_{\frac{\alpha }{2}}
∣T∣<T2α,接受
H
0
\displaystyle H_{0}
H0
c. 若
∣
T
∣
=
T
α
2
\displaystyle |T|=T_{\frac{\alpha }{2}}
∣T∣=T2α,再抽样再检验
因为选取的统计量服从T分布,所以这种检验方法叫T检验法 。
二、
σ
2
\displaystyle \sigma ^{2}
σ2的假设检验
从形式上,可以提出三种不同的假设:
(1)
H
0
:
σ
2
=
σ
0
2
,
H
1
:
σ
2
≠
σ
0
2
\displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} \neq \sigma {_{0}}^{2}
H0:σ2=σ02,H1:σ2=σ02
(2)
H
0
:
σ
2
⩽
σ
0
2
,
H
1
:
σ
2
>
σ
0
2
\displaystyle H_{0} :\sigma ^{2} \leqslant \sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} >\sigma {_{0}}^{2}
H0:σ2⩽σ02,H1:σ2>σ02
(3)
H
0
:
σ
2
⩾
σ
0
2
,
H
1
:
σ
2
<
σ
0
2
\displaystyle H_{0} :\sigma ^{2} \geqslant \sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} < \sigma {_{0}}^{2}
H0:σ2⩾σ02,H1:σ2<σ02
在具体解决的时候,经常把第(2)、(3)简化为
H
0
:
σ
2
=
σ
0
2
\displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2}
H0:σ2=σ02来处理,然后判断左右,所以下面的内容都只以形式(1)为例来对进行检验。
根据
u
\displaystyle u
u是否已知,分为两种情况:
1、
u
=
u
0
\displaystyle u =u_{0}
u=u0已知,检验
H
0
:
σ
2
=
σ
0
2
\displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2}
H0:σ2=σ02:
第一步:提出假设:
H
0
:
σ
2
=
σ
0
2
,
H
1
:
σ
2
≠
σ
0
2
\displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} \neq \sigma {_{0}}^{2}
H0:σ2=σ02,H1:σ2=σ02
第二步:假定
H
0
\displaystyle H_{0}
H0成立,选取检验统计量。若
H
0
\displaystyle H_{0}
H0成立,可以得到
X
∼
(
u
0
,
σ
0
2
)
\displaystyle X\sim \left( u_{0} ,\sigma {_{0}}^{2}\right)
X∼(u0,σ02),从这样子的整体抽样得到的样本
X
i
\displaystyle X_{i}
Xi与
X
\displaystyle X
X同分布,也就是抽样得到的样本
X
i
∼
(
u
0
,
σ
0
2
)
\displaystyle X_{i} \sim \left( u_{0} ,\sigma {_{0}}^{2}\right)
Xi∼(u0,σ02),
X
i
−
u
0
σ
0
∼
N
(
0
,
1
)
\displaystyle \frac{X_{i} -u_{0}}{\sigma _{0}} \sim N( 0,1)
σ0Xi−u0∼N(0,1)。我们现在要检验的是
σ
2
\displaystyle \sigma ^{2}
σ2,所以对标准差进行平方,得到
(
X
i
−
u
0
σ
0
)
2
∼
χ
2
(
1
)
\displaystyle \left(\frac{X_{i} -u_{0}}{\sigma _{0}}\right)^{2} \sim \chi ^{2}( 1)
(σ0Xi−u0)2∼χ2(1)。n个样本相加,得到
∑
i
=
1
n
(
X
i
−
u
0
)
σ
0
2
2
∼
χ
2
(
n
)
\displaystyle \frac{\sum _{i=1}^{n}( X_{i} -u_{0})}{\sigma {_{0}}^{2}}^{2} \sim \chi ^{2}( n)
σ02∑i=1n(Xi−u0)2∼χ2(n)。所以这里我们选取统计量
χ
2
=
∑
i
=
1
n
(
X
i
−
u
0
)
σ
0
2
2
∼
χ
2
(
n
)
\displaystyle \chi ^{2} =\frac{\sum _{i=1}^{n}( X_{i} -u_{0})}{\sigma {_{0}}^{2}}^{2} \sim \chi ^{2}( n)
χ2=σ02∑i=1n(Xi−u0)2∼χ2(n)。卡方分布图如下图:
第三步:给定
α
\displaystyle \alpha
α,差表可得
P
{
χ
2
>
χ
2
α
2
(
n
)
}
=
P
{
χ
2
<
χ
2
1
−
α
2
(
n
)
}
=
α
2
\displaystyle P\left\{\chi ^{2} >\chi ^{2}{}_{\frac{\alpha }{2}}( n)\right\} =P\left\{\chi ^{2} < \chi ^{2}{}_{1-\frac{\alpha }{2}}( n)\right\} =\frac{\alpha }{2}
P{χ2>χ22α(n)}=P{χ2<χ21−2α(n)}=2α对应 的
χ
2
α
2
(
n
)
\displaystyle \chi ^{2}{}_{\frac{\alpha }{2}}( n)
χ22α(n)、
χ
2
1
−
α
2
(
n
)
\displaystyle \chi ^{2}{}_{1-\frac{\alpha }{2}}( n)
χ21−2α(n)
第四步:计算
χ
2
\displaystyle \chi ^{2}
χ2的值,比较下结论。
因为选取的统计量服从卡方分布,所以这种检验方法叫卡方检验法 。
2、
u
\displaystyle u
u未已知,检验
H
0
:
σ
2
=
σ
0
2
\displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2}
H0:σ2=σ02:
第一步:提出假设:
H
0
:
σ
2
=
σ
0
2
,
H
1
:
σ
2
≠
σ
0
2
\displaystyle H_{0} :\sigma ^{2} =\sigma {_{0}}^{2} ,H_{1} :\sigma ^{2} \neq \sigma {_{0}}^{2}
H0:σ2=σ02,H1:σ2=σ02
第二步:假定
H
0
\displaystyle H_{0}
H0成立,选取检验统计量。若
H
0
\displaystyle H_{0}
H0成立,可以得到
X
∼
(
u
,
σ
0
2
)
\displaystyle X\sim \left( u ,\sigma {_{0}}^{2}\right)
X∼(u,σ02),当
u
\displaystyle u
u已知的时候,我们使用统计量
∑
i
=
1
n
(
X
i
−
u
0
)
σ
0
2
2
\displaystyle \frac{\sum _{i=1}^{n}( X_{i} -u_{0})}{\sigma {_{0}}^{2}}^{2}
σ02∑i=1n(Xi−u0)2,现在
u
\displaystyle u
u未知,我们使用样本均值
X
‾
\displaystyle \overline{X}
X来替代
u
\displaystyle u
u,得到统计量
χ
2
=
∑
i
=
1
n
(
X
i
−
X
‾
)
σ
0
2
2
\displaystyle \chi ^{2} =\frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{\sigma {_{0}}^{2}}^{2}
χ2=σ02∑i=1n(Xi−X)2,这个统计量服从什么分布呢?由公式
χ
2
=
(
n
−
1
)
S
σ
2
∼
χ
2
(
n
−
1
)
\displaystyle \chi ^{2} =\frac{( n-1) S}{\sigma ^{2}} \sim \chi ^{2}( n-1)
χ2=σ2(n−1)S∼χ2(n−1),
S
=
∑
i
=
1
n
(
X
i
−
X
‾
)
n
−
1
\displaystyle S= \frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{n-1}
S=n−1∑i=1n(Xi−X),约掉n-1得到
∑
i
=
1
n
(
X
i
−
X
‾
)
σ
0
2
2
\displaystyle \frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{\sigma {_{0}}^{2}}^{2}
σ02∑i=1n(Xi−X)2,所以这里选取的统计量是
χ
2
=
∑
i
=
1
n
(
X
i
−
X
‾
)
σ
0
2
2
=
(
n
−
1
)
S
σ
0
2
∼
χ
2
(
n
−
1
)
\displaystyle \chi ^{2} =\frac{\sum _{i=1}^{n}( X_{i} -\overline{X})}{\sigma {_{0}}^{2}}^{2} =\frac{( n-1) S}{\sigma {_{0}}^{2}} \sim \chi ^{2}( n-1)
χ2=σ02∑i=1n(Xi−X)2=σ02(n−1)S∼χ2(n−1)。
第三步:给定
α
\displaystyle \alpha
α,差表可得
P
{
χ
2
>
χ
2
α
2
(
n
−
1
)
}
=
P
{
χ
2
<
χ
2
1
−
α
2
(
n
−
1
)
}
=
α
2
\displaystyle P\left\{\chi ^{2} >\chi ^{2}{}_{\frac{\alpha }{2}}( n-1)\right\} =P\left\{\chi ^{2} < \chi ^{2}{}_{1-\frac{\alpha }{2}}( n-1)\right\} =\frac{\alpha }{2}
P{χ2>χ22α(n−1)}=P{χ2<χ21−2α(n−1)}=2α对应 的
χ
2
α
2
(
n
−
1
)
\displaystyle \chi ^{2}{}_{\frac{\alpha }{2}}( n-1)
χ22α(n−1)、
χ
2
1
−
α
2
(
n
−
1
)
\displaystyle \chi ^{2}{}_{1-\frac{\alpha }{2}}( n-1)
χ21−2α(n−1)
第四步:计算
χ
2
\displaystyle \chi ^{2}
χ2的值,比较下结论。
因为选取的统计量服从卡方分布,所以这种检验方法叫卡方检验法 。
两个正态总体的参数假设检验
假设两个独立的正态总体X和Y, X ∼ ( u 1 , σ 1 2 ) \displaystyle X\sim \left( u_{1} ,\sigma {_{1}}^{2}\right) X∼(u1,σ12), ( X 1 , X 2 , . . . , X n ) \displaystyle (X_{1} ,X_{2} ,...,X_{n} ) (X1,X2,...,Xn)是取自X的样本, X ‾ \displaystyle \overline{X} X是样本均值,样本方差 S 1 2 \displaystyle S{_{1}}^{2} S12; Y ∼ ( u 2 , σ 2 2 ) \displaystyle Y\sim \left( u_{2} ,\sigma {_{2}}^{2}\right) Y∼(u2,σ22), ( Y 1 , Y 2 , . . . , Y n ) \displaystyle (Y_{1} ,Y_{2} ,...,Y_{n} ) (Y1,Y2,...,Yn)是取自 Y \displaystyle Y Y的样本, Y ‾ \displaystyle \overline{Y} Y是样本均值,样本方差 S 2 2 \displaystyle S{_{2}}^{2} S22。
一、均值
u
1
\displaystyle u_{1}
u1、
u
2
\displaystyle u_{2}
u2的差异性检验
从形式上,可以提出三种不同的假设:
(1)
H
0
:
u
1
=
u
2
,
H
1
:
u
1
≠
u
2
\displaystyle H_{0} :u_{1} =u_{2} ,H_{1} :u_{1} \neq u_{2}
H0:u1=u2,H1:u1=u2,我们把这种称为双边假设,对应的检验叫双侧检验。
(2)
H
0
:
u
1
⩽
u
2
,
H
1
:
u
1
>
u
2
\displaystyle H_{0} :u_{1} \leqslant u_{2} ,H_{1} :u_{1} >u_{2}
H0:u1⩽u2,H1:u1>u2,拒绝域在右边,所以我们把这种称为右假设,对应的检验叫右侧检验(单边检测)。
(3)
H
0
:
u
1
⩾
u
2
,
H
1
:
u
1
<
u
2
\displaystyle H_{0} :u_{1} \geqslant u_{2} ,H_{1} :u_{1} < u_{2}
H0:u1⩾u2,H1:u1<u2,拒绝域在左边,所以我们把这种称为左假设,对应的检验叫左侧检验(单边检测)。
根据
σ
\displaystyle \sigma
σ是否已知,分为两种情况:
1、当
σ
1
2
\displaystyle \sigma {_{1}}^{2}
σ12、
σ
2
2
\displaystyle \sigma {_{2}}^{2}
σ22已知,检验
H
0
:
u
1
=
u
2
\displaystyle H_{0} :u_{1} =u_{2}
H0:u1=u2,以形式(1)为例来对进行检验:
第一步:提出假设:
H
0
:
u
1
=
u
2
,
H
1
:
u
1
≠
u
2
\displaystyle H_{0} :u_{1} =u_{2} ,H_{1} :u_{1} \neq u_{2}
H0:u1=u2,H1:u1=u2
第二步:假定
H
0
\displaystyle H_{0}
H0成立,选取检验统计量。从独立的正态总体X和Y抽样可得新的分布
X
‾
−
Y
‾
∼
N
(
u
1
−
u
2
,
σ
1
2
n
1
+
σ
2
2
n
2
)
\displaystyle \overline{X} -\overline{Y} \sim N\left( u_{1} -u_{2} ,\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}\right)
X−Y∼N(u1−u2,n1σ12+n2σ22),标准化为
U
=
X
‾
−
Y
‾
−
(
u
1
−
u
2
)
σ
1
2
n
1
+
σ
2
2
n
2
∼
N
(
0
,
1
)
\displaystyle U=\frac{\overline{X} -\overline{Y} -(u_{1} -u_{2} )}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}} \sim N( 0,1)
U=n1σ12+n2σ22X−Y−(u1−u2)∼N(0,1)。选取检验统计量
U
=
X
‾
−
Y
‾
−
(
u
1
−
u
2
)
σ
1
2
n
1
+
σ
2
2
n
2
=
X
‾
−
Y
‾
σ
1
2
n
1
+
σ
2
2
n
2
∼
N
(
0
,
1
)
\displaystyle U=\frac{\overline{X} -\overline{Y} -(u_{1} -u_{2} )}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}} =\frac{\overline{X} -\overline{Y}}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}} \sim N( 0,1)
U=n1σ12+n2σ22X−Y−(u1−u2)=n1σ12+n2σ22X−Y∼N(0,1)
第三步:给定
α
\displaystyle \alpha
α,差表可得
P
{
∣
U
∣
>
U
α
2
}
=
α
\displaystyle P\{|U| >U_{\frac{\alpha }{2}}\} =\alpha
P{∣U∣>U2α}=α对应 的
U
α
2
\displaystyle U_{\frac{\alpha }{2}}
U2α
第四步:计算
U
\displaystyle U
U的值,比较
∣
U
∣
\displaystyle |U|
∣U∣和
U
α
2
\displaystyle U_{\frac{\alpha }{2}}
U2α,下结论:
a. 若
∣
U
∣
>
U
α
2
\displaystyle |U| >U_{\frac{\alpha }{2}}
∣U∣>U2α,拒绝
H
0
\displaystyle H_{0}
H0
b. 若
∣
U
∣
<
U
α
2
\displaystyle |U|< U_{\frac{\alpha }{2}}
∣U∣<U2α,接受
H
0
\displaystyle H_{0}
H0
c. 若
∣
U
∣
=
U
α
2
\displaystyle |U|=U_{\frac{\alpha }{2}}
∣U∣=U2α,再抽样再检验
因为选取的统计量服从标准正态分布,所以这种检验方法叫U检验法 。
2、 当
σ
1
2
\displaystyle \sigma {_{1}}^{2}
σ12、
σ
2
2
\displaystyle \sigma {_{2}}^{2}
σ22未知,但
σ
1
2
=
σ
2
2
=
σ
2
\displaystyle \sigma {_{1}}^{2} =\sigma {_{2}}^{2} =\sigma ^{2}
σ12=σ22=σ2,检验
H
0
:
u
1
=
u
2
\displaystyle H_{0} :u_{1} =u_{2}
H0:u1=u2:
第一步:提出假设:
H
0
:
u
1
=
u
2
,
H
1
:
u
1
≠
u
2
\displaystyle H_{0} :u_{1} =u_{2} ,H_{1} :u_{1} \neq u_{2}
H0:u1=u2,H1:u1=u2
第二步:假定
H
0
\displaystyle H_{0}
H0成立,选取检验统计量。
(
n
1
−
1
)
S
1
2
σ
1
2
∼
χ
2
\displaystyle \frac{( n_{1} -1) S{_{1}}^{2}}{\sigma {_{1}}^{2}} \sim \chi ^{2}
σ12(n1−1)S12∼χ2,
(
n
2
−
1
)
S
2
2
σ
2
2
∼
χ
2
\displaystyle \frac{( n_{2} -1) S{_{2}}^{2}}{\sigma {_{2}}^{2}} \sim \chi ^{2}
σ22(n2−1)S22∼χ2,当
σ
1
2
=
σ
2
2
=
σ
2
\displaystyle \sigma {_{1}}^{2} =\sigma {_{2}}^{2} =\sigma ^{2}
σ12=σ22=σ2时,
(
n
1
−
1
)
S
1
2
σ
2
+
(
n
2
−
1
)
S
2
2
σ
2
∼
χ
2
(
n
1
+
n
2
−
2
)
\displaystyle \frac{( n_{1} -1) S{_{1}}^{2}}{\sigma ^{2}} +\frac{( n_{2} -1) S{_{2}}^{2}}{\sigma ^{2}} \sim \chi ^{2}( n_{1} +n_{2} -2)
σ2(n1−1)S12+σ2(n2−1)S22∼χ2(n1+n2−2)。通过构造t分布我们可以把
σ
2
\displaystyle \sigma ^{2}
σ2消掉,
t
=
U
(
n
1
−
1
)
S
1
2
σ
2
+
(
n
2
−
1
)
S
2
2
σ
2
/
(
n
1
+
n
2
−
2
)
=
X
‾
−
Y
‾
−
(
u
1
−
u
2
)
σ
1
2
n
1
+
σ
2
2
n
2
(
n
1
−
1
)
S
1
2
+
(
n
2
−
1
)
S
2
2
σ
2
/
(
n
1
+
n
2
−
2
)
=
X
‾
−
Y
‾
(
n
1
−
1
)
S
1
2
+
(
n
2
−
1
)
S
2
2
n
1
+
n
2
−
2
⋅
1
n
1
+
1
n
2
∼
t
(
n
1
+
n
2
−
2
)
\displaystyle t=\frac{U}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2}}{\sigma ^{2}} +\frac{( n_{2} -1) S{_{2}}^{2}}{\sigma ^{2}} /( n_{1} +n_{2} -2)}}=\frac{\frac{\overline{X} -\overline{Y} -(u_{1} -u_{2} )}{\sqrt{\frac{\sigma {_{1}}^{2}}{n_{1}} +\frac{\sigma {_{2}}^{2}}{n_{2}}}}}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2} +( n_{2} -1) S{_{2}}^{2}}{\sigma ^{2}} /( n_{1} +n_{2} -2)}}=\frac{\overline{X} -\overline{Y}}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2} +( n_{2} -1) S{_{2}}^{2}}{n_{1} +n_{2} -2}} \cdot \sqrt{\frac{1}{n_{1}} +\frac{1}{n_{2}}}} \sim t( n_{1} +n_{2} -2)
t=σ2(n1−1)S12+σ2(n2−1)S22/(n1+n2−2)U=σ2(n1−1)S12+(n2−1)S22/(n1+n2−2)n1σ12+n2σ22X−Y−(u1−u2)=n1+n2−2(n1−1)S12+(n2−1)S22⋅n11+n21X−Y∼t(n1+n2−2)
因此这里选取检验统计量
T
=
X
‾
−
Y
‾
(
n
1
−
1
)
S
1
2
+
(
n
2
−
1
)
S
2
2
n
1
+
n
2
−
2
⋅
1
n
1
+
1
n
2
\displaystyle T=\frac{\overline{X} -\overline{Y}}{\sqrt{\frac{( n_{1} -1) S{_{1}}^{2} +( n_{2} -1) S{_{2}}^{2}}{n_{1} +n_{2} -2}} \cdot \sqrt{\frac{1}{n_{1}} +\frac{1}{n_{2}}}}
T=n1+n2−2(n1−1)S12+(n2−1)S22⋅n11+n21X−Y
∼
t
(
n
1
+
n
2
−
2
)
\displaystyle \sim t( n_{1} +n_{2} -2)
∼t(n1+n2−2)
第三步:给定
α
\displaystyle \alpha
α,差表可得
P
{
∣
T
∣
>
t
α
2
}
=
α
\displaystyle P\{|T| >t_{\frac{\alpha }{2}}\} =\alpha
P{∣T∣>t2α}=α对应 的
t
α
2
(
n
1
+
n
2
−
2
)
\displaystyle t_{\frac{\alpha }{2}}( n_{1} +n_{2} -2)
t2α(n1+n2−2)
第四步:计算
T
\displaystyle T
T的值,比较
∣
T
∣
\displaystyle |T|
∣T∣和
t
α
2
\displaystyle t_{\frac{\alpha }{2}}
t2α,下结论:
a. 若
∣
T
∣
>
t
α
2
\displaystyle |T| >t_{\frac{\alpha }{2}}
∣T∣>t2α,拒绝
H
0
\displaystyle H_{0}
H0
b. 若
∣
T
∣
<
t
α
2
\displaystyle |T|< t_{\frac{\alpha }{2}}
∣T∣<t2α,接受
H
0
\displaystyle H_{0}
H0
c. 若
∣
T
∣
=
t
α
2
\displaystyle |T|=t_{\frac{\alpha }{2}}
∣T∣=t2α,再抽样再检验
因为选取的统计量服从T分布,所以这种检验方法叫T检验法 。
二、方差
σ
1
2
\displaystyle \sigma {_{1}}^{2}
σ12、
σ
2
2
\displaystyle \sigma {_{2}}^{2}
σ22的差异性检验
当
u
1
\displaystyle u_{1}
u1、
u
2
\displaystyle u_{2}
u2未知,检验
H
0
:
σ
1
2
=
σ
2
2
\displaystyle H_{0} :\sigma {_{1}}^{2} =\sigma {_{2}}^{2}
H0:σ12=σ22
第一步:提出假设:
H
0
:
σ
1
2
=
σ
2
2
,
H
1
:
σ
1
2
≠
σ
2
2
\displaystyle H_{0} :\sigma {_{1}}^{2} =\sigma {_{2}}^{2} ,H_{1} :\sigma {_{1}}^{2} \neq \sigma {_{2}}^{2}
H0:σ12=σ22,H1:σ12=σ22
第二步:假定
H
0
\displaystyle H_{0}
H0成立。取统计量
F
=
S
1
2
/
σ
1
2
S
2
2
/
σ
2
2
∼
F
(
n
1
−
1
,
n
2
−
1
)
\displaystyle F=\frac{S{_{1}}^{2} /\sigma {_{1}}^{2}}{S{_{2}}^{2} /\sigma {_{2}}^{2}} \sim F( n_{1} -1,n_{2} -1)
F=S22/σ22S12/σ12∼F(n1−1,n2−1),假设
σ
1
2
=
σ
2
2
\displaystyle \sigma {_{1}}^{2} =\sigma {_{2}}^{2}
σ12=σ22,则
F
=
S
1
2
S
2
2
∼
F
(
n
1
−
1
,
n
2
−
1
)
\displaystyle F=\frac{S{_{1}}^{2}}{S{_{2}}^{2}} \sim F( n_{1} -1,n_{2} -1)
F=S22S12∼F(n1−1,n2−1)。F分布如下图:
文章来源:https://www.toymoban.com/news/detail-502990.html
第三步:给定
α
\displaystyle \alpha
α,差表可得
P
{
F
>
F
α
2
(
n
1
−
1
,
n
2
−
1
)
}
=
P
{
F
<
F
1
−
α
2
(
n
1
−
1
,
n
2
−
1
)
}
=
α
2
\displaystyle P\{F >F_{\frac{\alpha }{2}}( n_{1} -1,n_{2} -1)\} =P\{F< F_{1-\frac{\alpha }{2}}( n_{1} -1,n_{2} -1)\} =\frac{\alpha }{2}
P{F>F2α(n1−1,n2−1)}=P{F<F1−2α(n1−1,n2−1)}=2α 对应 的
F
α
2
(
(
n
1
−
1
,
n
2
−
1
)
\displaystyle F_{\frac{\alpha }{2}}(( n_{1} -1,n_{2} -1)
F2α((n1−1,n2−1)、
F
1
−
α
2
(
(
n
1
−
1
,
n
2
−
1
)
\displaystyle F_{1-\frac{\alpha }{2}}(( n_{1} -1,n_{2} -1)
F1−2α((n1−1,n2−1)
第四步:计算F的值,比较下结论。
因为选取的统计量服从F分布,所以这种检验方法叫F检验法 。文章来源地址https://www.toymoban.com/news/detail-502990.html
到了这里,关于假设检验(hypothesis testing)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!