【Python】单样本、独立样本、配对样本的t检验

这篇具有很好参考价值的文章主要介绍了【Python】单样本、独立样本、配对样本的t检验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

python单样本t检验,python统计学,python,Powered by 金山文档

t检验通常分为三种,分别是单样本t检验、两独立样本t检验和配对样本t检验。

python中经常使用scipy模块中的t检验相关函数进行t检验。

单样本t检验使用ttest_1samp()函数。

独立样本t检验使用ttest_ind()函数。

配对样本t检验使用ttest_rel()函数。

一、单样本t检验

单样本t检验用于,在已知总体均数的情况下,样本均数𝑋与已知总体均数𝜇0的比较,其中样本均数𝑋代表未知总体均数𝜇

条件:

样本含量较小时,要求样本符合正态分布。

案例:

某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业的男性工人的血红蛋白含量均数是否等于正常成年男性的均数140g/L?

36名从事铅作业男性工人的血红蛋白含量: [112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,162,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,127]

假设检验的步骤:

  1. 建立假设检验,确定检验水准。

𝐻0:𝜇=𝜇0,即从事铅作业的男性工人与正常男性的血红蛋白含量均数相等。

𝐻1:𝜇≠𝜇0,即从事铅作业的男性工人与正常男性的血红蛋白含量均数不等。

𝛼=0.05

  1. 计算检验统计量。

  1. 确定P。

import numpy as np
from scipy import stats
hb1=np.array([112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,162,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,127]
)
## 正态性检验
stats.shapiro(hb1)

p>0.05,样本符合正态分布,可以进行单样本t检验

# 单样本t检验
stats.ttest_1samp(hb1,140)
python单样本t检验,python统计学,python,Powered by 金山文档

p<0.05,按𝛼=0.05α=0.05水准拒绝原假设𝐻0,接受备择假设𝐻1,差异有统计学意义,可以认为从事铅作业男性工人的平均血红蛋白含量低于正常成年男性的平均血红蛋白含量。

二、两独立样本t检验

独立样本t检验,用于两个完全独立的、符合正态分布的样本的均数比较。

根据两样本的方差是否相等,可分为:

  • 总体方差相等的t检验

  • 总体方差不等的t检验

在python中,使用scipy包的ttest_ind()函数来进行两独立样本的t检验,两样本不符合方差齐性时需要传入参数:eual_var=False,这个参数默认为True。

stats.shapiro()用于正态性检验。

stats.levene()用于方差齐性检验。

1. 总体方差相等的两独立样本t检验

案例:

为探讨青藤碱抗兔动脉粥样硬化作用,采用单纯高脂饲料12周喂养方法建立动脉粥样硬化家兔模型。将12周造模成功家兔随机等分为2组。模型组给予高脂饲料100g/d;青藤碱组除给与高脂饲料100g/d外,在饲料中添加青藤碱109mg/(kg·d)。连续喂养3周,试验结束后心脏采血,测定心脏血液中高密度脂蛋白。结果如下:

青藤碱组𝑋1:[0.66,0.76,0.79,0.88,0.78,0.66,0.75,0.88]

模型组𝑋2:[0.58,0.62,0.59,0.70,0.69,0.68,0.58,0.60]

根据以上结果能否认为模型组与青藤碱组心脏血液中高密度脂蛋白含量的总体均数不同?

X1=np.array([0.66,0.76,0.79,0.88,0.78,0.66,0.75,0.88])
X2=np.array([0.58,0.62,0.59,0.70,0.69,0.68,0.58,0.60])
# 正态性检验
print("X1组正态性检验结果:{}".format(stats.shapiro(X1)))
print("X2组正态性检验结果:{}".format(stats.shapiro(X2)))

# 方差齐性检验
print("X1与X2方差齐性检验结果:{}".format(stats.levene(X1,X2)))
python单样本t检验,python统计学,python,Powered by 金山文档

X1、X2组正态性检验的p值均大于0.05,符合正态分布。方差齐性检验的p值大于0.05,两样本符合方差齐性。

# 总体方差相等的两独立样本t检验
stats.ttest_ind(X1,X2)
python单样本t检验,python统计学,python,Powered by 金山文档

t检验p值小于0.05,按𝛼水准,拒绝𝐻0,接受𝐻1,差异具有统计学意义,可认为青藤碱组与模型组心脏血液中的HDL含量总体均数不同。

2. 总体方差不等的两独立样本t检验

案例:

为分析血糖控制对血清总胆固醇含量的影响,调查了某社区2型糖尿病患者,各测量了25名血糖控制较差(甲组)和25名血糖控制较好(乙组)的患者血清总胆固醇含量,结果如下:

甲组:[5.61,4.18,3.21,2.41,2.12,6.81,3.47,4.46,1.98,3.03,3.96,4.91,4.42,6.92,4.89,2.99,3.51,5.91,4.90,4.59,5.04,4.16,4.91,4.85,4.70]

乙组:[4.76,6.54,5.65,5.30,4.96,6.30,6.17,4.40,5.75,4.42,4.54,5.10,5.37,4.21,5.44,5.81,4.65,6.05,4.82,5.53,5.0,4.66,4.37,4.42,4.38]

根据以上结果能否认为两组血清总胆固醇含量的总体均数不同?

grp1=np.array([5.61,4.18,3.21,2.41,2.12,6.81,3.47,4.46,1.98,3.03,3.96,4.91,4.42,6.92,4.89,2.99,3.51,5.91,4.90,4.59,5.04,4.16,4.91,4.85,4.70])
grp2=np.array([4.76,6.54,5.65,5.30,4.96,6.30,6.17,4.40,5.75,4.42,4.54,5.10,5.37,4.21,5.44,5.81,4.65,6.05,4.82,5.53,5.0,4.66,4.37,4.42,4.38])
# 正态性检验
print("甲组正态性检验结果:{}".format(stats.shapiro(grp1)))
print("乙组正态性检验结果:{}".format(stats.shapiro(grp2)))

# 方差齐性检验
print("两组方差齐性检验结果为:{}".format(stats.levene(grp1,grp2)))
python单样本t检验,python统计学,python,Powered by 金山文档
# 总体方差不等的两独立样本t检验
stats.ttest_ind(grp1,grp2,equal_var=False)
python单样本t检验,python统计学,python,Powered by 金山文档

p<0.05,按𝛼=0.05水准,拒绝𝐻0,接受𝐻1,差异具有统计学意义,可以认为血糖控制较差者和良好者血清总胆固醇含量的总体均数不同。

三、配对样本t检验

配对样本t检验适用于配对设计或自身对照设计的计量资料的比较。

配对设计是将受试对象按照某些重要特征配成对子,再将每对中的两个受试对象随机分配到两处理组。

stats.ttest_lsmap():在python中可以将配对数据求差值后,对差值进行已知总体均数为0的单样本t检验,来求得t检验统计量和p值。

stats.ttest_rel():或是对配对数据直接调用stats.ttest_rel()函数进行t检验。

案例:

为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定,结果如下:

哥特里-罗紫法:[0.840,0.591,0.674,0.632,0.687,0.978,0.750,0.730,1.200,0.870]

脂肪酸水解法:[0.580,0.509,0.500,0.316,0.337,0.517,0.454,0.512,0.997,0.506]

问两种方法的测定结果是否不同?

fun1=np.array([0.840,0.591,0.674,0.632,0.687,0.978,0.750,0.730,1.200,0.870])
fun2=np.array([0.580,0.509,0.500,0.316,0.337,0.517,0.454,0.512,0.997,0.506])
sub=fun1-fun2
# 正态性检验
stats.shapiro(sub)
# 配对样本t检验
stats.ttest_rel(fun1,fun2)
stats.ttest_1samp(sub,0)
python单样本t检验,python统计学,python,Powered by 金山文档

p<0.05,按𝛼=0.5水准,拒绝𝐻0,接受𝐻1,差异具有统计学意义,可以认为两种方法对脂肪含量的测定结果不同。文章来源地址https://www.toymoban.com/news/detail-753129.html

到了这里,关于【Python】单样本、独立样本、配对样本的t检验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【应用统计学】简单随机抽样的区间估计和样本容量的确定

    1.总体服从正态分布,且方差已知 若随机变量X服从正态分布,那么它抽样分布的 样本均值 也服正态分布。同时,我们可以先将它转化为标准正态分布 根据区间估计的定义,我们可以构造总体均值μ的置信区间。对于给定的显著性水平 α ,有  将式(5.13)代入上式得到:  对上

    2024年02月11日
    浏览(28)
  • 《SPSS统计学基础与实证研究应用精解》视频讲解:变量和样本观测值基本操作

    《SPSS统计学基础与实证研究应用精解》4.1 视频讲解 视频为 《SPSS统计学基础与实证研究应用精解》张甜 杨维忠著 清华大学出版社 一书的随书赠送视频讲解4.1节内容 。本书已正式出版上市,当当、京东、淘宝等平台热销中,搜索书名即可。本书旨在手把手教会使用SPSS撰写实

    2024年01月21日
    浏览(28)
  • Python 机器学习入门:数据集、数据类型和统计学

    机器学习是通过研究数据和统计信息使计算机学习的过程。机器学习是迈向人工智能(AI)的一步。机器学习是一个分析数据并学会预测结果的程序。 在计算机的思维中,数据集是任何数据的集合。它可以是从数组到完整数据库的任何东西。 数组的示例: [99,86,87,88,111,86,10

    2024年02月05日
    浏览(38)
  • AI人工智能中的概率论与统计学原理与Python实战:35. Python实现量子计算与量子机器学习...

    量子计算和量子机器学习是人工智能领域的一个重要分支,它们利用量子物理现象来解决一些传统计算方法无法解决的问题。量子计算的核心是量子比特(qubit),它可以存储多种信息,而不是传统的二进制比特(bit)。量子机器学习则利用量子计算的优势,为机器学习问题提供更

    2024年04月14日
    浏览(49)
  • AI人工智能中的概率论与统计学原理与Python实战:隐马尔可夫模型(HMM)的理解与实现...

    随着人工智能技术的不断发展,人工智能已经成为了许多行业的核心技术之一。在人工智能中,概率论和统计学是非常重要的一部分,它们可以帮助我们更好地理解和解决问题。在本文中,我们将讨论概率论与统计学原理在人工智能中的应用,以及如何使用Python实现隐马尔可

    2024年04月10日
    浏览(42)
  • 统计学 - 数理统计与应用统计的区别

    目录 1. 概率与统计 2. 数理统计与应用统计 概率论是研究随机现象数量规律的数学分支。随机现象是相对于决定性现象而言的,在一定条件下必然发生某一结果的现象称为决定性现象。例如在标准大气压,纯水加热到100℃时水必然会沸腾等。随机现象则是指在基本条件不变的

    2024年02月13日
    浏览(42)
  • 《SPSS统计学基础与实证研究应用精解》视频讲解:SPSS依托统计学处理数据的应用场景

    《SPSS统计学基础与实证研究应用精解》1.4 视频讲解 视频为 《SPSS统计学基础与实证研究应用精解》张甜 杨维忠著 清华大学出版社 一书的随书赠送视频讲解1.4节内容 。本书已正式出版上市,当当、京东、淘宝等平台热销中,搜索书名即可。本书旨在手把手教会使用SPSS撰写实

    2024年01月23日
    浏览(41)
  • 【应用统计学】方差分析

    【例7-1】 三台设备平均灌装时间分别是15.82秒、16.67秒和14.97秒。试用样本数据检验这3台机器灌装过程的时间是否存在显著不同,以便对设备的购买做出决策。( α=0.05 )  如果检验结果 接受原假设 ,则样本数据表明三台设备的平均灌装时间没有显著差异,选择任何一家提供商

    2023年04月16日
    浏览(34)
  • 统计学期末复习整理

    统计学:描述统计学和推断统计学。计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。 描述统计中的测度: 1.数据分布的集中趋势 2.数据分布的离散程度 3.数据分布的形状。 离散系数 也称为标准差系数,通常是用一组数据的标准差与其平均数之比计算 C . V . = s x ‾

    2024年02月07日
    浏览(36)
  • 统计学 一元线性回归

    回归(Regression) :假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,利用该模型根据给定的自变量来预测因变量 线性回归 :因变量和自变量之间是线性关系 非线性回归 :因变量和自变量之间是非线性关系 变量间的关系 :往往分为 函数关系

    2024年02月06日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包