卫生统计学 SAS代码复习-Toy模板网

这篇具有很好参考价值的文章主要介绍了卫生统计学 SAS代码复习。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

t检验

单样本t检验

DATA t1;
INPUT x@@;
CARDS;
20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00
;
PROC UNIVARIATE mu0=20.70 NORMAL;
VAR x;
RUN;

这段SAS代码的意义如下：

PROC UNIVARIATE：指定使用单变量分析过程。

mu0=20.70：指定假设总体均值为20.70。

NORMAL：指定数据符合正态分布。

VAR x：指定变量x为分析对象。

RUN：运行程序。综上，这段代码的意义是对变量x进行单变量分析，假设其均值为20.70，数据符合正态分布。

结果：首先进行统计描述，再正态性检验，最后求出置信区间与进行假设检验。

sas正态性检验代码,线性回归,逻辑回归,sass,Powered by 金山文档

说明：

如果样本来自于正态分布的总体，那么样本数据也很可能符合正态分布。但是，由于样本容量较小或者存在离群值等情况，样本数据可能并不完全符合正态分布。因此，为了保证假设检验的准确性，需要对样本数据的正态性进行检验，例如使用Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法。如果样本数据不符合正态分布，可以考虑进行数据变换或者使用非参数检验方法。

Shapiro-Wilk检验是用于检验样本是否符合正态分布的一种方法，该检验是在原假设为样本来自于正态分布的情况下进行的，如果得出的p值小于预先设定的显著性水平（通常为0.05），则拒绝原假设，即认为样本不符合正态分布。原假设为“样本来自的总体与正态分布无显著性差异，即符合正态分布”。

配对t检验

DATA t2;
INPUT d@@;
CARDS;
3.48
7.41
7.48
9.42
8.25
3.35
6.95
7.41
6.35
7.41
8.58
;
PROC UNIVARIATE NORMAL;
VAR d;
RUN;
PROC MEANS MEAN STD T PRT CLM;
VAR d;
RUN;

这段SAS代码的意义如下：

第一部分：

PROC UNIVARIATE NORMAL：指定使用单变量分析过程，并假设数据符合正态分布。

VAR d：指定变量d为分析对象。

RUN：运行程序。综上，这段代码的意义是对变量d进行单变量分析，假设其符合正态分布。

n<2000, use Shapiro-wilk. n>2000, use Kolmogo-Smirnov.

第二部分：

PROC MEANS：指定使用均值过程。

MEAN STD T PRT CLM：指定输出均值、标准差、t值、p值和置信区间。

VAR d：指定变量d为分析对象。

RUN：运行程序。综上，这段代码的意义是计算变量d的均值、标准差、t值、p值和置信区间。

结果

两个独立样本t检验

data t3;
input group wt@@;
cards;
1 134
1 146
1 104
1 119
1 124
1 161
1 107
1 83
1 113
1 129
1 97
1 123
2 70
2 118
2 101
2 85
2 107
2 132
2 94 
;
/*调用univariate进行正态性检验*/
proc univariate normal;
var wt;
class group;
run;
/*调用ttest过程进行两独立样本的T检验*/
proc ttest;
class group;
var wt;
run;