统计学下的假设检验

这篇具有很好参考价值的文章主要介绍了统计学下的假设检验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        由于本人才疏学浅,再加上时间仓促,难免有疏漏之处,恳请批评指正.

1,预备知识

        数理统计:以概率论为基础,研究如何有效的去搜集、整理、分析带随机性影响的数据

        总体与样本:研究对象的全体就称为总体

        样本:假设需要测试某一个指标X,从总体中抽取n个个体,且这n个个体的指标为(),则称这n个个体的指标为一个样本

        统计量:样本来自于总体,是总体的反映,是进行总体的推断的依据。然而,分散的样本统计意义不明显,需要对样本进行浓缩,构造一个合适的依赖样本的函数来解决问题,这种函数就称为统计量

        常见的统计量包括:样本均值,样本方差,样本标准差,样本k阶原点矩,k阶中心矩。

        抽样分布:统计量的分布即抽样分布。统计量是样本的函数,抽样分布函数可以从样本的联合分布函数中推出,当总体的分布函数已知,则抽样分布也是确定的。这里大家先主要了解抽样分布有哪些,抽样分布对于假设检验,构造统计量有很大的帮助。

        下面简单介绍有哪些抽样分布及其简单的构造形式,具体的性质不做赘述,大家自行查阅。

                1)分布:设 独立同分布与标准正态分布,则称统计量

统计学下的假设检验

服从自由度为 n的分布,记为 ~ 

                2)F分布:设U ~ , V ~ ,且U,V相互独立,则称随机变量

 服从自由度为(m ,n)的F分布,记为F ~ F(m, n)

                3) t分布:设X ~ Y ~ ,且X和Y独立,则称随机变量

 服从自由度为n的t分布,记为t ~ t(n).

2,统计学中的假设检验

2.1 导论 

        统计推断是利用样本资料中的所得到的信息估计有关总体的一些未知参数。而假设检验问题,也差不多,是利用已经采样的信息去对未知的参数进行估计。

        举一个简单的例子,某公司过去很长一段时间的不合格率不超过0.01,某天随机抽样100件,发现有3件产品不合格,那不合格的产品出现的频率是0.03。显然,当天的不合格率已经超过了0.01,这能说明生产过程已经不稳定了吗?

        其实不然,这个时候就需要用更加具体的数学方法进行检验,这一类问题就是假设检验问题。

        再仔细分析一下上面的问题,当天所以进行抽样一次的产品其实满足于一个二项分布B(1,)(0<<1),这里的是产品的不合格率,于是所谓的生产过程就是,否则就是

 ,于是就将原始的问题转化为统计假设问题。

        针对上面问题,提出两个猜想:原假设和备择假设,数学语言表示为:

 这里就涉及到原假设和备择假设的理解:一般来说,我们定义原假设和备择假设是一对互补的命题。原假设和备择假设我认为有一个用途,就是便于转化为统计的问题求解概率。

        通过一些操作,判断在当前的采集的样本下,满足原假设的概率,如果概率很小,就认为这是一个小概率事件,几乎不可能发生,那么就拒绝原假设(认为原假设是错误的),否则就接受原假设。

         以上就是假设检验最根本的思想,再换一种更加便于理解的来阐述:在一定的统计假设的前提下,如果发生了小概率事件,就有理由怀疑假设的真实性,从而拒绝原假设。小概率事件不会发生。

        现在已经对假设检验的思想有了基本的了解,了解了什么是原假设和备择假设。

2.2 检验统计量,临界值和拒绝域

        前面讲到了,对原始问题需要经过一系列操作,将其转化为概率问题,并判断这是否是一个小概率事件。现在就讲解这个操作是什么。

        现在我们已经采集了一些样本,但是还需要对样本进行加工,把样本中的关于总体未知参数的信息集中起来,构造一个适合于检验假设的统计量,一般来说,假设检验最难的部分就是构造合适的检验统计量。

        在本题中,可以设置,则T服从二项分布, 明显的,当T处在一个较小值,为真;否则不真。因此,我们可以提前设置一个阈值C,则有

,拒绝原假设

, 接受原假设

 这里的T就称为检验统计量(就是这个玩意最难搞)和阈值。

        拒绝域就是处于可以拒绝原假设的样本空间范围内的样本,转化为数学语言就是:

        当样本的观察值属于W的时候,就拒绝原假设,就称为拒绝域。还有接受域。

2.3 两类错误

        第一类错误:原假设本身是正确的的(本题中,这个生产过程本就不稳定,观察值却显示的异常,落到了拒绝域中),但是做出了不真的判断,犯了“弃真”的错误。

        第二类错误:原假设是错误的,但是判断成正确的,犯了“存伪”的错误。

        通常来说,这两类错误是互斥的,要较小第一类错误,减小(在参数为theta的情况下,犯第一类错误的概率),就需要扩大临界值C,减小拒绝域。而要减小第二类错误,就需要减小临界值C的范围,增大拒绝域。

        于是,大佬奈曼(Neyman)和皮尔逊(Pearson)就说,要先控制第一类的错误(不能冤枉一个好人),给定一个(显著性水平 ),限制第一类错误不超过,在此基础上,再尽可能的减小第二类错误。这就是假设检验中著名的N - P准则。

2.4 水平为的检验(相当于对前面的解答)

        犯第一类错误的概率不超过的检验称为显著性水平为的检验,简称为水平为的检验。

        则这里的拒绝域是:

         那么,在本题中的犯第一类错误的概率就是:

统计学下的假设检验

 根据二项分布的p检验,可知,则

统计学下的假设检验

 此时需要再统计学下的假设检验,找到一个最小值。最后重要的一步,写出拒绝域,便于后续进行判断:

        若100件抽样产品中,发现了3件不合格品。

        在 = 0.1时, = 3,此时,则落在拒绝域中,拒绝H0,认为生产过程不稳定。从置信水平来看,现在有90%的把握认为可以拒绝H0,认为生产过程不稳定。

        在 = 0.05的时候,  = 4,此时,则落在拒绝域中,不能拒绝H0,认为生产过程稳定正常。从置信水平上来看,有95%的把握,可以拒绝H0,认为生产过程认为生产过程不稳定。但是这样的程度就降低了。

        这里面的细节可以好好体味一下。

 2.5 一般处理假设检验的步骤

  1. 根据实际问题,提出原假设和备择假设
  2. 确定检验统计量T(x)
  3. 确定第一类错误的表达形式,记住需要利用统计量进行表达,这样便于求出阈值
  4. 设置显著性水平,并使得犯第一类错误的概率最大值尽可能的接近,求出统计量的阈值,并写出其拒绝域的表达形式
  5. 最后,计算统计样本的检验统计量的值,并判断其是否落在拒绝域中,若落入拒绝域,则拒绝H0

下面开始介绍一些常见的假设检验的方法,都是基于正态分布衍生出来的分布,其中包括常见的t检验,F检验等等,会逐一的系统性的介绍到

2.6 单个正态总体的假设检验

 前提:认定均来自于正态总体的样本,记为:

,

2.6.1 单个正态分布总体均值的假设检验

1, 已知

(1) 

          这种情况,就先完整的按照之前的步骤进行写一遍。

                1)原假设和备择假设已给出
                2)确定检验统计量,这里需要对进行检验,我们可以选择作为检验统计量

                3)确定拒绝域:由于是 的估计,因此,当H0为真的时候,不应该太小,于是给出拒绝域

                 4)确定发生第一类错误的概率:

 由于其是正态分布,故可以转化为标准正态分布的概率累计函数。其中统计学下的假设检验,在取得最大值

 

         这一步的转化,首先需要理解什么是上分位点,就是在置信水平为下,从其概率的累计值为的值。但是在这里的是显著性水平。因此,需要转化为.

        举一个例子,假设现在取显著性水平 = 0.05,则

,

        意思是当取值为-1.645时,这里定义的是上分位点的值,则>-1.645概率有95%。若U小于-1.645,则认为其是小概率事件,应当拒绝原假设。

(2) 

         同理可得,通过计算,这里的拒绝域可以设置为.

(3) 

        则这里需要进行双边假设,拒绝域应为

2,未知

        这个时候,前一节的统计量就不满足,因为未知,那么就用S来代替,可以得到:

        具体推到的方法,类似于构造t分布得到的,这里不做详细的介绍。

        这就是著名的t分布,在未知数据的方差的情况下,分布的均值做估计。在t分布中,X(参照上文中提到的公式)是服从标准正态分布的,于是要求t检验的数据也是要来自于正态分布。这个要求就比较苛刻了,也有说法说,只要数据量够大也可以直接使用t检验,因为有大数定理。详情可以参看博客不满足正态分布,到底能不能用t检验。这里先给出建议:       

        1,若原数据服从正态分布,则进行t检验

        2,若原数据偏离正态分布较大,则进行非参数检验Wilcoxon rank-sum检验

        3,若数据量较大:二者均可

                若偏离程度较小,一般30个以上就可以执行t检验

                若偏离程度较大,100个以上可以执行t检验

2.7 秩和检验(检验两个采样数据的分布是否来自于同一个分布)

        设X和Y是来自于两个连续分布函数和,其采样的独立样本分别是和。则在显著性水平下,检验假设:

统计学下的假设检验

        秩和其实就是rank,排名,用数学化的语言来表示:存在一个样本从小到大的排序则有:

        其中,,则称的秩为k。

        其思想就是来自于同一个分布的值混合在一起之后进行排序,则这两个分布的值排完序之后不会偏向某一边。构造的统计量就是秩和。

        由于关系,这里不做赘述,大家可以查看博客秩和检验。

 以上就是统计学中假设检验的基础部分。文章来源地址https://www.toymoban.com/news/detail-443786.html

到了这里,关于统计学下的假设检验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 统计学期末复习整理

    统计学:描述统计学和推断统计学。计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。 描述统计中的测度: 1.数据分布的集中趋势 2.数据分布的离散程度 3.数据分布的形状。 离散系数 也称为标准差系数,通常是用一组数据的标准差与其平均数之比计算 C . V . = s x ‾

    2024年02月07日
    浏览(33)
  • 【应用统计学】方差分析

    【例7-1】 三台设备平均灌装时间分别是15.82秒、16.67秒和14.97秒。试用样本数据检验这3台机器灌装过程的时间是否存在显著不同,以便对设备的购买做出决策。( α=0.05 )  如果检验结果 接受原假设 ,则样本数据表明三台设备的平均灌装时间没有显著差异,选择任何一家提供商

    2023年04月16日
    浏览(31)
  • SCAU 统计学 实验5

    8.14 总体平均值(μ):7.0 cm 总体方差(σ²):0.03 cm² 样本平均值(x̄):6.97 cm 样本方差(s²):0.0375 cm² 样本大小(n):80 在这个问题中,我们已经知道总体方差(σ²),所以应该使用 z 检验。 将检验以下零假设(H₀): H₀: μ = 7.0 cm 与备择假设(H₁): H₁: μ ≠

    2024年02月01日
    浏览(28)
  • 数据科学、统计学、商业分析

    数据科学、统计学、商业分析是在各方面有着不同的侧重和方向的领域。  1.专业技能 数据科学(Data Science):数据科学涉及从大量数据中提取有价值的信息、模式和洞察力的领域。它使用多种技术和领域知识,如统计学、机器学习、数据库管理、数据可视化等,进行数据清

    2024年02月15日
    浏览(37)
  • 统计学-R语言-3

    本篇文章是介绍对数据的部分图形可视化的图型展现。 需要注意的是,给直方图拟合正态分布曲线并非总是适用,有时甚至是荒谬的,容易产生误导。合理的做法是为直方图拟合一条核密度估计曲线,它是数据实际分布的一种近似描述。 下面通过一个实际例子说明给直方图

    2024年01月16日
    浏览(32)
  • 统计学-R语言-1

    统计学(statistics)是“数据的科学” 1.是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 2.统计学进行推断的基础是数据(data)。数据不仅仅限于数字,也可能是图表、视频、音频或者文字。 3.收集到数据之后,利用一些方法来整理和分析数据,最后得到结

    2024年02月03日
    浏览(31)
  • 卫生统计学 SAS代码复习

    这段SAS代码的意义如下: PROC UNIVARIATE :指定使用单变量分析过程。 mu0 =20.70 :指定假设 总体均值 为20.70。 NORMAL :指定数据符合正态分布。 VAR x :指定变量x为分析对象。 RUN :运行程序。综上, 这段代码的意义是对变量x进行单变量分析,假设其均值为20.70 ,数据符合正态

    2024年02月10日
    浏览(19)
  • 统计学-R语言-4.5

    本篇文章将继续对数据的类型做介绍,本片也是最后一个介绍数据的。 掌握描述多变量数据的分析方法:多维列联表、复式条形图、并列箱线图、点带图、多变量散点图(重叠散点图和矩阵式散点图)。 除了一维表、二维表,在实际中更多的是多维表,也就是多个变量交叉

    2024年02月01日
    浏览(36)
  • 统计学-R语言-5.2

    本篇文章将继续上篇的进行介绍。 大数定理大数定理”的另一种表达方式是“均值定理”,其含义是,随机变量X多个观察值的均值会随着观察值的增加越发趋近于总体的期望值,中心极限定理进一步告诉我们,均值服从期望为μ 的正态分布。在各种测量试验中,我们一般都

    2024年01月18日
    浏览(34)
  • 统计学-R语言-4.4

    上一篇文章介绍的是单变量数据,本篇将介绍双变量数据。 描述分类数据对分类数据的描述方法:二维表、复式条形图。 描述分类型数据对数值型数据的描述方法:箱线图。 描述数值型数据对数值型数据的描述方法:散点图、相关系数。 二维表(two-dimensional table)是两个变

    2024年01月19日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包