【SAS应用统计分析】数据的描述性统计分析

这篇具有很好参考价值的文章主要介绍了【SAS应用统计分析】数据的描述性统计分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

声明:本文知识参考内容来自网络,如有侵权请联系删除。本文还参照了B站up主庄7的课程内容【公开课】数据分析与SAS【15课】

目录

实验原理

描述性统计量

1.反映数据集中趋势的特征量

2.反映数据离散程度的特征量

3.反映数据分布形状的特征量

数据的图形描述

直方图

箱线图

茎叶图

实例分析

【means过程简介】

 MEANS过程的语句格式

语句说明

 【univariate过程简介】

proc univariate过程格式

 语句说明

实验步骤

步骤一

步骤二

步骤三

总结


实验原理

对数据集的描述性分析分为图形描述和描述性统计量。

描述性统计量

1.反映数据集中趋势的特征量

反映数据集中趋势的特征量有均值、众数、中位数和分位数

(1)均值:,它描述数据取的平均位置,但会受极端数值的影响;

(2)众数:数据中出现频数最多的值,它不受极端值的影响;

(3)分位数:设,,,是容量为n的样本观测值,样本p分位数(0<p<1)记为,它具有以下性质:

  • 至少有np个观测值不小于或等于
  • 至少有n(1-p)个观念值大于或等于               

2.反映数据离散程度的特征量

反映数据离散程度有方差、标准差、极差、变异系数和标准误差

(1)方差: ;

(2)标准差:;

(3)极差:或;

(4)四分位极差:;

(5)变异系数:;

(6)标准误差:;

3.反映数据分布形状的特征量

(1)偏度:  , 它是描述数据分布的偏斜程度的特征量, 当  时, 分布为右偏;当  时, 分布关于其均值对称, 不一定是绝对的对称分布;

当时,分布为左偏。

(2)峰度:【SAS应用统计分析】数据的描述性统计分析,它刻画分布的峰峭性。峰度的取值范围为【SAS应用统计分析】数据的描述性统计分析,完全服从正态分布的数据的峰度值为 3,峰度值越大,概率分布越高尖,峰度值越小,越矮胖。一个分布的峰度:当时,则标准化后的分布状态与标准正态分布相当;当时,则标准化后的分布状态比标准正态分布更尖峭(高峰度)。

数据的图形描述

直方图

箱线图

【SAS应用统计分析】数据的描述性统计分析

箱线图是用来表示一组或多组连续型数据分布的中心位置散布范围的图形,因形似箱子故取名为箱线图。

箱子的中间一条线,是数据的中位数,代表了样本数据的平均水平。

 箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。

箱子的高度在一定程度上反映了数据的波动程度。

在箱子的上方和下方,各有一条线。代表最大最小值,有时候会有一些点“冒出去”,可以理解成"异常值"
原文链接:(2条消息) 箱线图(boxplot)_SixdayNots的博客-CSDN博客

茎叶图

实例分析

例1:在做小麦育种时,调查了杂交后代的若干性状,选取其中一部分数据见实验一的表中,在表中例举了4个变量,即:株高、穗长、穗粒数和成熟早晚。分别用hop、loe、nog和fas代表上述四个变量,以成熟的早(e)、中(m)、晚(l)分类,分别计算株高与穗长的平均数、标准差和标准误差以及穗粒数的范围赫尔变异

例2:现有68个抽样数据 6.5 5.1 6.1 3.9 3.5 7.7 2.1 1.9 9.6 7.9 7.6 7.8 4.6 6.1 6.4 2.8 7.6 2.5 4.6 8.1 4.8 6.9 5.1 2.0 6.4 6.0 4.5 8.0 8.0 8.6 6.4 4.9 6.4 6.8 4.7 3.4 7.7 1.2 2.8 0.5 2.6 3.2 6.5 7.6 3.5 5.7 5.4 2.3 7.4 2.7 4.2 6.4 6.9 7.2 6.7 6.5 4.0 7.3 1.1 4.9 2.5 2.9 1.9 3.6 1.4 2.5 4.4 2.5要求计算此单变量数据的描述统计量,并分析此抽样数据的统计特征

【means过程简介】

【SAS应用统计分析】数据的描述性统计分析

 MEANS过程的语句格式

【SAS应用统计分析】数据的描述性统计分析

 文章来源地址https://www.toymoban.com/news/detail-428342.html

【SAS应用统计分析】数据的描述性统计分析

语句说明

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

【SAS应用统计分析】数据的描述性统计分析

 

 【univariate过程简介】

proc univariate过程格式

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

 语句说明

 

【SAS应用统计分析】数据的描述性统计分析

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

 

实验步骤

例1实验步骤

步骤一

建立一个外部数据文件xiaomai.dat,并且保存在“D:\SAS\sasdata\shiyan\xiaomai.dat”中

步骤二

用proc means过程计算描述统计量

options linesize=76;                                                                                                                    
data xiaomai;                                                                                                                           
        infile'D:\SAS\sasdata\shiyan\xiaomai.dat' ;                                                                                      
        input hop loe nog fas $;                                                                                                        
run;                                                                                                                                    
proc means maxdec=2 fw=8 max min mean std stderr;                                                                                       
        var hop loe;                                                                                                                    
        class fas;                                                                                                                      
proc means data=xiaomai range cv;                                                                                                       
        var nog;                                                                                                                        
        class fas;                                                                                                                      
run;

【SAS应用统计分析】数据的描述性统计分析

 程序的运行结果如下:

【SAS应用统计分析】数据的描述性统计分析

【SAS应用统计分析】数据的描述性统计分析

 

 

例2实验步骤

步骤三

用proc univariate过程计算描述统计量,并分析此抽样数据的统计特征

代码:

data aa03;     /*创建临时数据集aa03*/                                                                                                                         
input x @@;                                                                                                                             
cards;                                                                                                                                  
6.5 5.1 6.1 3.9 3.5 7.7 2.1 1.9 9.6 7.9 7.6 7.8 4.6 6.1 6.4                                                                             
 2.8 7.6 2.5?4.6 8.1 4.8 6.9 5.1 2.0 6.4 6.0 4.5 8.0 8.0 8.6                                                                            
 6.4 4.9 6.4 6.8 4.7 3.4 7.7 1.2 2.8 0.5 2.6 3.2 6.5 7.6 3.5                                                                            
 5.7 5.4 2.3 7.4 2.7 4.2 6.4 6.9 7.2 6.7 6.5 4.0 7.3 1.1 4.9                                                                            
 2.5 2.9 1.9 3.6 1.4 2.5?4.4 2.5                                                                                                        
;                                                                                                                                       
run;                                                                                                                                    
proc univariate data = aa03 plot normal;       /*调用univariate过程计算统计量,选项plot要求绘制茎叶图、箱线图和正态分布图,选项normal要求对抽样数据进行正态性检验*/                                                                                         
var x;                                                                                                                                  
run;

运行结果: 

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

 

【SAS应用统计分析】数据的描述性统计分析

 

总结

  • 掌握proc means过程和proc univariate过程计算基本统计量
  • 检验变量是否服从正态分布
  • 掌握建立外部数据文件并将外部数据文件转化为SAS数据集的方法

到了这里,关于【SAS应用统计分析】数据的描述性统计分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python 数据分析】描述性统计:平均数(均值)、方差、标准差、极大值、极小值、中位数、百分位数、用箱型图表示分位数

    前面讲了数据分析中的第一步:数据预处理,下面就是数据分析的其中一个重头戏:描述性统计,具体内容为: 平均数(均值)、方差、标准差、极大值、极小值、中位数、百分位数、用箱型图表示分位数 。 关键方法 含义 .mean() 求均值 .var() 求方差 .std() 求标准差 .max() 求极

    2024年01月21日
    浏览(43)
  • 数据的统计描述和分析——假设检验

    对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设. 1. 参数检验 :如果观测的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验

    2024年02月14日
    浏览(43)
  • 统计学基础1:描述性统计(数据的离散度、极差、方差、标准差)

    1、频数:一组定量数据中,每一个数值发生的次数即为频数。 2、频率:将每一个数值发生的次数除以样本总数量,即频率

    2023年04月10日
    浏览(45)
  • 标准正态变换(SPSS统计描述分析)

    题目:对 CCSS_Sample中的总指数、现状指数和预期指数进行标准正态变换,对变换后的变量进行统计描述。 数据文件:CCSS_Sample.csv 本篇文章小玥各位学习SPSS软件里面的 标 准正 态变 换!!! 目录  一、前言 二、题目分析 1、分析: 三、解题步骤 1、先对总指数、现状指数和

    2024年02月05日
    浏览(40)
  • 描述性统计图表——散点图

    适用范围:当估计两个变量之间存在相关关系时,用散点图进行确认,并观察和确定两者的关系强度。还可以用散点图分析坐标点的分布模式,如“风险机遇评估矩阵”。 即便自变量为连续性变量,仍然可以使用散点图。也就是说散点图通过散点的疏密程度和变化趋势表示二

    2024年02月01日
    浏览(89)
  • R语言实验1 :数据的描述性分析

    实验 1     数据的描述性分析 一、实验目的 1. 掌握理解均值、方差等一系列统计相关概念。 2. 加深对散点图、直方图、相关系数等概念的理解。 3. 熟悉R语言等语言的集成开发环境。 二、实验分析与内容 完成教材P37第6题。 题目如下: ( 1 )(1)分别计算数学成绩和统计学成

    2024年01月18日
    浏览(47)
  • R语言生物群落(生态)数据统计分析与绘图实践技术应用

    R 语言作的开源、自由、免费等特点使其广泛应用于生物群落数据统计分析。生物群落数据多样而复杂,涉及众多统计分析方法。以生物群落数据分析中的最常用的统计方法回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法为主线,通过多个来自经典研究中

    2024年02月08日
    浏览(43)
  • 描述性统计图表——直方图

    概念:直方图是频数直方图的简称,通常用来描述类别数据。它是用一系列宽度相等、高度不等的长方形表示数据的图。长方形的宽度表示数据范围的间隔,长方形的高度表示在给定间隔内的数据数。一般横轴表示数据类型,纵轴表示分布情况。直方图也可以被归一化以显示

    2024年02月06日
    浏览(56)
  • 数理统计SPSS软件实验报告一--描述性统计

    实验报告内容: 1 、实验目的: 熟练掌握利用SPSS进行描述性统计分析的基本技能。 2 、实验要求: (1) 利用SPSS软件计算常用统计量(样本均值、中位数、众数、分位数;最大值、最小值、极差、总和、样本方差、样本标准差、变异系数;偏度系数、峰度系数等)的值; (2)

    2023年04月12日
    浏览(56)
  • 电商API接口的应用||大数据电商数仓分析项目||电商热门商品统计

    如何定义热门商品? 简单模型:直接通过用户对商品的点击量来衡量商品热度。 复杂模型:依据各类别权重(后续补充) 如何获取区域? 通过用户点击日志,获取访问IP,进而获取区域信息。 通过数据库中的订单关联用户表,获取用户的地域信息 如何去除爬虫水军(商家

    2024年04月28日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包