python统计(二)假设检验

这篇具有很好参考价值的文章主要介绍了python统计(二)假设检验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

单总体参数的假设检验

python统计(二)假设检验

单总体均值的检验

DescrStatsW.ztest_mean()

statsmodels.stats.weightstats.DescrStatsW.ztest_mean(value=0, alternative='two-sided')

参数

说明

value

假设的均值

alternative

备择假设的形式,可选值:‘two-sided’, ‘larger’, ‘smaller’

weightstats.ztest()

statsmodels.stats.weightstats.ztest(x1, x2=None, value=0, alternative='two-sided')

参数

说明

x1, x2

独立样本数据,x2可为None,用于单总体检验

value

假设值

alternative

备择假设的形式,可选值:‘two-sided’, ‘larger’, ‘smaller’

例1: 国家要求含水量不超过4%,能否认为该生产厂商该批次的饼干符合要求?(显著水平取0.05)

                

单侧检验

python统计(二)假设检验 python统计(二)假设检验

python统计(二)假设检验

python统计(二)假设检验

返回值均为一个元组,第一个元素是计算出的统计量,第二个元素是p值

p=0.67 远大于 0.05,因此没有理由拒绝原假设,即没有理由认为该厂商生产的该批次饼干是不合格的。

DescrStatsW.ttest_mean()

statsmodels.stats.weightstats.DescrStatsW.ttest_mean(value=0, alternative='two-sided')

参数

说明

value

假设的均值

alternative

备择假设的形式,可选值:‘two-sided’, ‘larger’, ‘smaller’

ttest_1samp() 

scipy.stats.ttest_1samp(a, popmean)

参数

说明

a

样本数据

popmean

假设均值

例2: 某移动通信公司对其用户进行满意度评估,公司认为用户满意度应该超过82分,为此公司进行了小规模的调查,得到25各用户评价满意度得分。试在显著性水平0.05条件下,对该公司的用户满意度进行评估。

                

单侧检验

python统计(二)假设检验

python统计(二)假设检验

p值远大于0.05, 没有充分理由拒绝原假设,即没有理由认为该公司的用户总体评价会大于82分。

python统计(二)假设检验

python统计(二)假设检验

注意:re是双侧检验的p值,如果备择假设取“<”符号当t>=0时,进行判定得单侧p值=1-Pvalue/2; t<0时,p=Pvalue/2; 取“>”符号:当t>=0时,p=Pvalue/2; t<0时,p=1-Pvalue/2

单总体比例的假设检验

binom_test() 二项分布检验

scipy.stats.binom_test(x, n=None, p=0.5, alternative=’two-sided’)

参数

说明

x

‘成功’的样本数量

n

样本总数量

p

假设的比例值

alternative

备择假设的形式,可选值:‘two-sided’, ‘greater’, ‘less’ 

proportions_ztest() 正态分布检验

statsmodels.stats.proportion.proportions_ztest(count, nobs, value=None, alternative='two-sided')

参数

说明

count

‘成功’的样本数量

nobs

样本总数量

value

假设的比例值

alternative

备择假设的形式,可选值:‘two-sided’, ‘larger’, ‘smaller’ 

*smaller: prop < valuelarger: prop > value

例3: 一批产品中随机抽取100个,95个合格,5个不合格,根据相关规定,该种产品合格率应当大于97%,那么在显著性水平a=0.05下,能否认为该批次产品不合格? 

                

python统计(二)假设检验

python统计(二)假设检验

 p值明显大于0.05,故不能拒绝原假设,可以认为该批次产品合格


两总体参数的假设检验

python统计(二)假设检验

两个独立样本均值之差的假设检验

ttest_ind() t检验

 - scipy.stats库

scipy.stats.ttest_ind(a, b, axis=0, equal_var=True)

参数

说明

a, b

两组样本数据,应具有相同的形状(shape)

axis

多维数组的数据读取方向

equal_var

是否要求方差齐性

- statsmodels模块 

statsmodels.stats.weightstats.ttest_ind(x1, x2, alternative='two-sided', usevar='pooled', value=0)

参数

说明

x1, x2

两组样本数据,应具有相同的形状(shape)

alternative

备择假设的形式,可选值:‘two-sided’, ‘larger’, ‘smaller’ 

usevar

是否要求方差齐性: pooled – 要求,unequal – 不要求

value

指定原假设取等号时的检验值

例4: 为了检验两种新生产工艺对电池续航能力是否有明显的影响,随机抽取了两种新工艺生产的同批次电池,在同一型号笔记本电脑上的放电时间(小时)。设显著性a=0.01,检验这两种工艺对电池续航时间影响是否有显著差异。 

python统计(二)假设检验

battery.csv 

按照工艺分类,提取为两个DataFrame

 python统计(二)假设检验

python统计(二)假设检验

 68为自由度:70-2

python统计(二)假设检验

 大样本也可以采用z检验

独立样本比例之差的假设检验

两个总体比例是否有差异或检验其差异的具体数值; 通常用Z统计量进行检验

proportions_ztest() 正态分布检验

与单总体检验几乎相同,If this is array_like,注意nobs和count长度相同

关于 value:In the case of a two-sample test, the null hypothesis is that prop[0] - prop[1] = value, where prop is the proportion in the two samples. If not provided value = 0 and the null is prop[0] = prop[1]. 即,双总体检验时,value是两个比例之差,若没有给出value则默认为0

在两个样本检验中,smaller意味着备择假设成立,而larger意味着 ,即:

smaller          
larger  

例5: 某出版集团为了对旗下两本时尚杂志进行精确的市场定位,分别对两本杂志读者的性别进行了随机的抽样调查,试在显著性水平g=0.01条件下分析两本杂志读者性别的差异性。

假设经过经验判断,订阅了杂志1的女性占比为0.4,订阅了杂志2的女性占比为0.7,检验二者的差异是否超过了0.3。

                

python统计(二)假设检验

python统计(二)假设检验

统计性别为Female的读者对两本杂志的选择情况 

python统计(二)假设检验

统计所有读者对两本杂志的选择情况 

 python统计(二)假设检验

p值远大于0.05, 没有充分理由拒绝原假设,二者的差异没有超过0.3,故两本杂志读者的性别没有显著差异

成对样本的假设检验

两个样本不互相独立,但是组成成对样本的不同个体之间的观测值是相对独立的,因此,可以先把两个样本中配对的观测值逐个相减,形成一个由独立观测值组成的样本,然后用单样本检验方法取进行统计推断

ttest_rel()

scipy.stats.ttest_rel(a, b, axis=0)

参数

说明

a, b

两组样本数据,应具有相同的形状(shape)

axis

多维数组的数据读取方向

例6: 为考察某市市民生活的幸福程度,连续多年对固定样本进行调查。随着社会经济的快速发展,幸福度是否会得到提升呢?(设显著性水平a=0.05) 随机抽取了2015,2016两年中200个样本进行分析。

假设幸福度没有得到提升

                

python统计(二)假设检验
python统计(二)假设检验

p远大于0.05,无法拒绝原假设,不能认为市民的幸福度得到显著提升。

或者:假设幸福度得到了提升,,

python统计(二)假设检验

说明样本均值中看,第二年比第一年的幸福度高,但p值远远大于0.05,不能拒绝原假设,故可以认为幸福度得到了提升。这样与第一种假设得出的结论完全相反,这是因为原假设只能被证伪,而不能被证实!想证实的结论应该设置为备择假设而不是原假设!故给出一些原假设与备择假设选取时尽量遵循的规则:

双侧检验

问: 有无显著变化
验证: 没有显著变化
原假设: 有显著变化,等号放在原假设

单侧检验

问:有无显著提高
验证:有显著提高
原假设:没有显著提高,等号放在原假设

python统计(二)假设检验文章来源地址https://www.toymoban.com/news/detail-408135.html

到了这里,关于python统计(二)假设检验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据的统计描述和分析——假设检验

    对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设. 1. 参数检验 :如果观测的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验

    2024年02月14日
    浏览(31)
  • 统计基础:3.1_假设检验综述

      假设检验的思想和方法是根据小概率原理,具体地说当我们对问题提出原假设H0和备注假设H1,并要检验H0是否可信时,可以先假设H0是正确的,在此假设下,经过一次抽样,若发生小概率事件,可以根据“小概率事件在一次实验中几乎是不可能发生的”的理由,怀疑原假

    2024年02月11日
    浏览(26)
  • 统计学下的假设检验

            由于本人才疏学浅,再加上时间仓促,难免有疏漏之处,恳请批评指正.         数理统计: 以概率论为基础,研究如何有效的去搜集、整理、分析带随机性影响的数据         总体与样本: 研究对象的全体就称为总体          样本: 假设需要测试某一个指标

    2024年02月04日
    浏览(33)
  • 《统计学》——思考题第八章假设检验(贾俊平)

    目录 1、假设检验和参数估计有什么相同点和不同点? 2、什么是假设检验中的显著性水平?统计显著是什么意思? 3、什么是假设检验中的两类错误? 4、两类错误之间存在什么样的数量关系? 5、解释假设检验中的 P 值。 6、显著性水平与 P 值有何区别? 7、假设检验依据的

    2024年02月11日
    浏览(26)
  • 参数估计和假设检验的区别与联系

    笔记来源: 参数估计与假设检验 参数估计和假设检验有什么区别? 参数估计和假设检验是推断统计的两个组成部分,它们都是根据样本信息对总体的数量特征进行推断 下图来自《统计学图鉴》 参数估计和假设检验都是以抽样分布为理论依据,建立在概率论基础之上的统计

    2024年02月09日
    浏览(26)
  • 2023年数学建模:参数估计与假设检验:自助法(Bootstrap)详解

    目录 1. 引言 2. 自助法简介 3. 自助法在参数估计中的应用 3.1 原理

    2024年02月08日
    浏览(33)
  • R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享...

    综合社会调查(GSS)是由国家舆论研究中心开展的一项观察性研究。自 1972 年以来,GSS 一直通过收集当代社会的数据来监测社会学和态度趋势。其目的是解释态度、行为和属性的趋势和常量。从 1972 年到 2004 年,GSS 的目标人群是居住在家庭中的成年人(18 岁以上) ( 点击文

    2024年02月10日
    浏览(24)
  • 【考研数学】概率论与数理统计 —— 第七章 | 参数估计(2,参数估计量的评价、正态总体的区间估计)

    设 X X X 为总体, ( X 1 , X 2 , ⋯   , X n ) (X_1,X_2,cdots ,X_n) ( X 1 ​ , X 2 ​ , ⋯ , X n ​ ) 为来自总体 X X X 的简单随机样本, θ theta θ 为未知参数,设 θ ^ = φ ( X 1 , X 2 , ⋯   , X n ) widehat{theta}=varphi(X_1,X_2,cdots,X_n) θ = φ ( X 1 ​ , X 2 ​ , ⋯ , X n ​ ) 为参数 θ theta θ 的一个点估

    2024年02月06日
    浏览(34)
  • 假设检验/T检验/F检验/Z检验/卡方检验

    ****显著性水平: 一个概率值,原假设为真时,拒绝原假设的概率,表示为 alpha 常用取值为0.01, 0.05, 0.10 ****什么是P值? p值是当原假设为真时样本观察结果及更极端结果出现的概率。 如果P值很小,说明这种情况发生的概率很小,如果这种情况还出现了,那么就有理由拒绝原

    2024年02月05日
    浏览(30)
  • 假设检验:如何理解单侧、双侧检验的拒绝域

            简单说就是:拒绝域与备择假设方向相同。假设检验就是一个证伪的过程,原假设和备择假设是一对\\\"相反的结论\\\"。\\\"拒绝域\\\",顾名思义,就是拒绝原假设的范围和方向,所以判断拒绝域在哪,可以直接看备择假设H1的条件是大于还是小于即可。 上述只是判断方法之一

    2024年02月03日
    浏览(24)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包