相关系数及其假设检验——matlab及spss实现

这篇具有很好参考价值的文章主要介绍了相关系数及其假设检验——matlab及spss实现。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

数学建模中,相关性分析往往是建模的前提。但是,相关系数是数学建模中最容易出错滥用的点,需要注意不同相关系数的使用条件。

一.Pearson相关系数及其假设性检验

1.1 Pearson相关系数的定义及计算

(1)总体的Pearson相关系数

spss工具matlab,matlab,开发语言

 (2)样本的Pearson相关系数

spss工具matlab,matlab,开发语言

 (3)Pearson相关系数的误区:

  • 理解误区1——散点图和皮尔逊相关系数的联系(垂直x轴或者垂直y轴时,Person相关系数计算为零)<—— Person相关系数只是用来衡量线性相关程度的指标,只有确定了两个变量是线性相关的,这个相关系数才能用来衡量相关程度
  • 易错点1——非线性相关也会导致线性相关系数很大—>Person相关系数高不能证明具有线性相关性
  • 易错点2——离群点对相关系数的影响很大->用Person相关系数进行分析时,考虑去除异常值
  • 易错点3——如果两个变量的相关系数高也不能说明两者相关->Person相关系数高不能证明线性函数具有很大相关性,也有可能是受到异常值影响
  • 易错点4——Person相关系数计算结果为零,不能认为没有相关性,也许有比线性相关更复杂的相关性

总而言之,Pearson相关系数能够有力使用的前提是

  • 该相关系数只能识别简单的线性相关关系,无法处理非线性相关关系;
  • 对异常值(或离群点)和样本容量较为敏感;
  • 要求研究的变量是数值变量,且变量符合或较为接近正态分布。
  • 每组样本之间是独立抽样的(需要加在论文假设前提里)

相关系数的大小能够说明两者的相关程度,但我们往往更关注相关系数的显著性。

1.2 Pearson相关系数的假设性检验

(1)假设检验的步骤

  1. 确定原假设:相关系数为0(即两个变量不相关)和备择假设:相关系数不为0(即两个变量可能相关)
  2. 在原假设成立的条件下,构造一个统计量,该统计量有一个分布
  3. 画出概率密度函数图
  4. 给一个置信水平β,求出接受域
  5. 用已知的样本数据代入计算统计量,得到检测值,若检测值落在接受域内,则无法拒绝原假设,否则拒绝原假设

(2)pearson相关系数的假设性检验

对pearson相关系数而言,我们构造统计量,是服从自由度为的分布

查表:t分布表T分布表 - 百度文库

但我们一般不用查表法,而用p值判断法:利用检测值t,计算出对应的概率

单边检验

双边检验

用计算出的概率值p与0.01,0.05,0.10比较:spss工具matlab,matlab,开发语言

显著性越小,在更大的概率上,两者可能存在相关关系。即***越多,显著性越强,这个相关系数的置信程度越大。

1.3 正态分布的假设检验

(1)JB检验(Jarque-Bera test)

spss工具matlab,matlab,开发语言

条件:

大样本 n>30

matlab实现:

[h,p]=jbtest(x,alpha)% x是向量,alpha是显著性水平

jb检验只能一组一组进行检验
h=1时拒绝原假设,即不满足正态分布
h=0时接受原假设,即满足正态分布

(2)Shapiro-wilk检验

条件:

小样本 3<=n<=50

SPSS实现:

分析->描述统计->探索->图,含检验的数据图

(3)QQ图

条件:

数据量非常大

matlab实现:

qqplot(Test(:,1))

只能一列一列进行检验

1.4 matlab及spss实现

(1)描述性分析

1.matlab

spss工具matlab,matlab,开发语言

 例如,min(Test)计算每一列的最小值。注意,基本统计量的自变量可以是矩阵。

2.SPSS

分析->描述统计->描述

(2)矩阵的散点图

散点图可以初步确定变量是否有线性相关性,我们需要画出个变量的散点图。

用SPSS比较方便:

图形->旧对话框->散点图/点图->矩阵散点图

(3)Pearson相关系数的计算

matlab实现

R = corrcoef(Test)

Test可以是个矩阵

R = corrcoe(A,B)

A,B在这里必须是两个向量

(4)Pearson相关系数假设性检验的t统计量的计算

matlab实现

[R,P]=corrcoef(Test)

也就是说corr()可以同时给出相关系数和p值

画出t分布的图

x=-4:0.1:4

y=tpdf(x,28)

plot(x,y,'-')

grid on % 加上网格线

(5)美化相关系数表,美化p值表

1.相关系数表

a.EXCEL行列调成适合的大小,字号,对齐方式

b.选中相关系数表,开始-条件格式-色阶

c.选中相关系数表,条件格式-管理规则-编辑规则

2.显著性表

a.EXCEL行列调成适合的大小,字号,对齐方式

b.matlab筛选出矩阵,excel手动给表格加*文章来源地址https://www.toymoban.com/news/detail-774251.html

matlab命令

P<0.01

(P<0.05).*(P>0.01)

(P<0.1).*(P>0.05)

二.Spearman等级相关系数及其假设检验

2.1 Spearman相关系数的定义及计算

spss工具matlab,matlab,开发语言

也可以定义成等价之间的pearson相关系数。 

2.2 Spearman相关系数的假设性检验

(1)小样本

直接查临界值表(即系数本身就服从某种分布)spss工具matlab,matlab,开发语言

 (2)大样本

2.3 matlab及spss实现

(1)描述性分析

1.matlab

spss工具matlab,matlab,开发语言

 例如,min(Test)计算每一列的最小值。注意,基本统计量的自变量可以是矩阵。

2.SPSS

分析->描述统计->描述

(2)SPearsman相关系数的计算

matlab实现:

定义一

corr(X,Y,'type','Spearman')I
X,Y必须是列向量
corr(X,'type','Spearman')
计算X矩阵之间的spearman相关系数

定义二

RX=[2 5 3 4 1]

RY=[1 4.5 3 4.5 2]

R = corrcoef[RX,RY]

(3)计算Spearman相关系数的p值

matlab实现

[R,P]=corr(Test,'type','Spearman')

也就是说corr()可以同时给出相关系数和p值

(4)美化相关系数表,美化p值表

1.相关系数表

a.EXCEL行列调成适合的大小,字号,对齐方式

b.选中相关系数表,开始-条件格式-色阶

c.选中相关系数表,条件格式-管理规则-编辑规则

2.显著性表

a.EXCEL行列调成适合的大小,字号,对齐方式

b.matlab筛选出矩阵,excel手动给表格加*

P<0.01

(P<0.05).*(P>0.01)

(P<0.1).*(P>0.05)

三.总结

  1. 连续数据,正态分布,线性关系,用pearson相关系数是最恰当的
  2. 上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数
  3. 两个定序数据也用spearman相关系数,不能用pearson相关系数
  4. 90%都用spearman相关系数

到了这里,关于相关系数及其假设检验——matlab及spss实现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【SPSS】SPSS之相关系数矩阵(Pearson)

    使用 SPSS 的双变量相关分析菜单,采用皮尔逊相关系数,同时命令软件【标记显著性相关性】。 点击“文件”-“导入数据”-“Excel” 读取Excel文件-点击“确定” 点击“分析” “分析”-“相关”-“双变量” 导入变量,点击确定 我们把得出的矩阵复制到word里,并删除掉【显

    2024年02月11日
    浏览(32)
  • 【数学建模】《实战数学建模:例题与讲解》第六讲-假设检验(含Matlab代码)

    如果这篇文章对你有帮助,欢迎点赞与收藏~ 假设检验是一种统计决策过程,用于判断样本数据是否支持某个特定的假设。主要有两类假设: 零假设(Null Hypothesis):通常表示为没有效应或差异的假设。 备择假设(Alternative Hypothesis):表示有效应或差异的假设。 假设检验的

    2024年02月03日
    浏览(38)
  • 皮尔逊相关系数及代码实现(C语言+MATLAB)

    皮尔逊相关系数,常用于度量两个变量X和Y之间的相关性(线性相关)。本文通过介绍其 概念定义、数学公式 ,进而引出其 适用场合 ,并基于 MATLAB和C语言 对皮尔逊相关系数分别进行了 代码实现 。 在统计学中, 皮尔逊相关系数( Pearson correlation coefficient) ,又称皮尔逊积

    2024年02月06日
    浏览(28)
  • 概率统计·假设检验【正态总体均值的假设检验、正态总体方差的假设检验】

    第1类错误(弃真):当原假设H 0 为真,观察值却落入拒绝域,因而拒 绝H 0 这类错误是“以真为假” 犯第一类错误的概率=显著性水平α 第2类错误(取伪):当原假设H 0 不真,而观察值却落入接受域,因而 接受H 0 以假为真 若H 0 为真,则样本值落入拒绝域{Zz α/2 }的概率是

    2024年02月08日
    浏览(42)
  • 假设检验/T检验/F检验/Z检验/卡方检验

    ****显著性水平: 一个概率值,原假设为真时,拒绝原假设的概率,表示为 alpha 常用取值为0.01, 0.05, 0.10 ****什么是P值? p值是当原假设为真时样本观察结果及更极端结果出现的概率。 如果P值很小,说明这种情况发生的概率很小,如果这种情况还出现了,那么就有理由拒绝原

    2024年02月05日
    浏览(34)
  • 【统计】假设检验方法 一、方差齐性检验

    1. 不同检验方法 最小样本量 的确认 由统计量反推得到 2. 检验方法 方差齐性检验(F检验): 两个独立样本的方差差异检验,反映了平均值的代表性。方差齐次检验前提要近似正态分布。 正态性检验: 是否符合正态分布 似然比检验: 比较样本不同似然函数,检验其分布 参

    2023年04月14日
    浏览(34)
  • 假设检验:如何理解单侧、双侧检验的拒绝域

            简单说就是:拒绝域与备择假设方向相同。假设检验就是一个证伪的过程,原假设和备择假设是一对\\\"相反的结论\\\"。\\\"拒绝域\\\",顾名思义,就是拒绝原假设的范围和方向,所以判断拒绝域在哪,可以直接看备择假设H1的条件是大于还是小于即可。 上述只是判断方法之一

    2024年02月03日
    浏览(25)
  • SPSS参数检验、非参数检验、方差分析

    在做数据分析的时候,不是只要有数据,就拿去做模型,也有很多数据,结合需求,是不需要用到模型的,比如: 奶茶店,老板想看一下,合作时间(年份为单位)与奶茶店销量的关系与差异。 像这样,只有一个自变量和一个因变量的数据,做模型效果是非常差的,也不能

    2023年04月08日
    浏览(34)
  • 数学建模-假设检验

    原假设,备择假设 P值,显著性水平 单侧建议,双侧检验

    2024年02月16日
    浏览(35)
  • 【统计】假设检验方法

    1. 不同检验方法 最小样本量 的确认 由统计量反推得到 2. 检验方法 方差齐性检验(F检验): 两个独立样本的方差差异检验,反映了平均值的代表性。方差齐次检验前提要近似正态分布。 正态性检验: 是否符合正态分布 似然比检验: 比较样本不同似然函数,检验其分布 参

    2024年02月05日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包