t检验
单样本t检验
DATA t1;
INPUT x@@;
CARDS;
20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00
;
PROC UNIVARIATE mu0=20.70 NORMAL;
VAR x;
RUN;
这段SAS代码的意义如下:
PROC UNIVARIATE:指定使用单变量分析过程。
mu0=20.70:指定假设总体均值为20.70。
NORMAL:指定数据符合正态分布。
VAR x:指定变量x为分析对象。
RUN:运行程序。综上,这段代码的意义是对变量x进行单变量分析,假设其均值为20.70,数据符合正态分布。
结果:首先进行统计描述,再正态性检验,最后求出置信区间与进行假设检验。
说明:
如果样本来自于正态分布的总体,那么样本数据也很可能符合正态分布。但是,由于样本容量较小或者存在离群值等情况,样本数据可能并不完全符合正态分布。因此,为了保证假设检验的准确性,需要对样本数据的正态性进行检验,例如使用Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法。如果样本数据不符合正态分布,可以考虑进行数据变换或者使用非参数检验方法。
Shapiro-Wilk检验是用于检验样本是否符合正态分布的一种方法,该检验是在原假设为样本来自于正态分布的情况下进行的,如果得出的p值小于预先设定的显著性水平(通常为0.05),则拒绝原假设,即认为样本不符合正态分布。原假设为“样本来自的总体与正态分布无显著性差异,即符合正态分布”。
配对t检验
DATA t2;
INPUT d@@;
CARDS;
3.48
7.41
7.48
9.42
8.25
3.35
6.95
7.41
6.35
7.41
8.58
;
PROC UNIVARIATE NORMAL;
VAR d;
RUN;
PROC MEANS MEAN STD T PRT CLM;
VAR d;
RUN;
这段SAS代码的意义如下:
第一部分:
PROC UNIVARIATE NORMAL:指定使用单变量分析过程,并假设数据符合正态分布。
VAR d:指定变量d为分析对象。
RUN:运行程序。综上,这段代码的意义是对变量d进行单变量分析,假设其符合正态分布。
n<2000, use Shapiro-wilk. n>2000, use Kolmogo-Smirnov.
第二部分:
PROC MEANS:指定使用均值过程。
MEAN STD T PRT CLM:指定输出均值、标准差、t值、p值和置信区间。
VAR d:指定变量d为分析对象。
RUN:运行程序。综上,这段代码的意义是计算变量d的均值、标准差、t值、p值和置信区间。
结果
两个独立样本t检验
data t3;
input group wt@@;
cards;
1 134
1 146
1 104
1 119
1 124
1 161
1 107
1 83
1 113
1 129
1 97
1 123
2 70
2 118
2 101
2 85
2 107
2 132
2 94
;
/*调用univariate进行正态性检验*/
proc univariate normal;
var wt;
class group;
run;
/*调用ttest过程进行两独立样本的T检验*/
proc ttest;
class group;
var wt;
run;
PROC TTEST:指定使用t检验过程。
CLASS group:指定变量group为分类变量。
VAR wt:指定变量wt为分析对象。文章来源:https://www.toymoban.com/news/detail-685857.html
RUN:运行程序文章来源地址https://www.toymoban.com/news/detail-685857.html
到了这里,关于卫生统计学 SAS代码复习的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!