数学建模冲国奖之——Person相关系数和Spearman相关系数

这篇具有很好参考价值的文章主要介绍了数学建模冲国奖之——Person相关系数和Spearman相关系数。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

person系数,数学建模,数学建模

 

目录

一、简介

二、Person相关系数

三、相关性可视化

四、皮尔逊相关系数的理解误区

五、对皮尔逊相关系数的两点总结

六、Person系数习题

七、Person系数假设检验适用前提

八、Spearman相关系数

九、Spearman相关系数假设检验 

十、两者适用性


一、简介

本讲我们介绍两种最常用的相关系数:person相关系数和spearman相关系数。他们用来衡量两个变量之间的相关性大小,根据数据的不同特点,我们要选择不同的系数进行计算和分析(选择哪个系数也是论文中最容易出错的地方)。实际中,更多会使用spearman相关系数,因为person系数的限制条件会更多。

二——七:Perosn相关系数

八——九:Spearman相关系数

十:两者适用性


二、Person相关系数

1.总体Person相关系数

如果两组数据X:{X1,X1,```,Xn}和Y:{Y1,Y2,```,Yn}是总体数据(比如普查结果)

那么总体均值为: 

总体协方差:

总体Person相关系数为:

其中,,分别是X的标准差和Y的标准差,

最终可以证明:,当person系数,数学建模,数学建模, 则  ;


2.样本Person相关系数

如果两组数据X:{X1,X1,```,Xn}和Y:{Y1,Y2,```,Yn}是样本数据(比如调查得到的数据)

样本均值:

样本协方差:

样本Person相关系数:

其中,


三、相关性可视化

通过绘制散点图可以很容易地判定两个数据对象x和y之间的相关性:person系数,数学建模,数学建模 


四、皮尔逊相关系数的理解误区

先给出五张图:

person系数,数学建模,数学建模

图一、二、三、四

person系数,数学建模,数学建模

图五

对于上面四个图的数据来说,Person系数都是0.816 

图一:还可以理解,大多点确实分布在拟合线的周围

图二:表现出的是二次函数的点

图三:有一个异常值,导致拟合线受到影响

图四:有一个异常值,但是拟合线相当离谱! (假设把异常值去了,那么X4和Y4可以说是毫无关系的)

图五:显然根据生活经验,冰淇淋销量和温度是有很大的相关性的,但是Person却是0

虽然四幅图的分布都完全不同,但是他们的Person系数确实都是0.816!

 接下来给出解释:相关系数只是用来衡量两个变量线性相关程度的指标;也就是说,在使用Person系数之前,必须先确认这两个变量是线性相关的,然后这个相关系数才能告诉你这两个变量的相关程度。

 根据上述解释的原理,我们再回过头解释这四幅图:

  1. 非线性先关也会导致线性相关系数很大,如图二
  2. 离群点(异常值)对相关系数的影响很大,例如图三,去掉离群点之后的相关系数为0.98
  3. 如果两个变量的相关系数很大也不能说明两者相关,比如图四,有可能是受到了异常值的影响
  4. 相关系数计算为0,只能说明不是线性相关,但说不定会有更复杂的关系(非线性相关),比如图五

五、对皮尔逊相关系数的两点总结

(1)如果两个变量本身就是线性的关系,那么皮尔逊相关系数的绝对值大的就是相关性强,小的就是相关性弱。

(2)在不确定两个变量是什么关系的情况下,即使算出了Person系数发现很大,也不能说明两个变量线性先关,甚至不能说明这两个变量是相关的。因此我们必须要画出散点图来看才行。

(3)事实上,比起相关系数的大小,在实际中我们更关注显著性(假设检验)。


六、Person系数习题

现有某中学八年级女生的体测数据样本,见下表,试计算各变量之间的Person相关系数。

            person系数,数学建模,数学建模

方法一:通过matlab代码计算(具体模板代码可以三连后私信我)

方法二:通过spss 24.0版本 软件快速得到结果(软件破解版安装可以三连后私信我)

通过spss得到如下散点图结果:

person系数,数学建模,数学建模

通过spss得到如下描述性统计:

person系数,数学建模,数学建模

 通过将结果导入excel,使用excel的色阶工具得到如下比较美观的图(可以放到论文中):

                         person系数,数学建模,数学建模


七、Person系数假设检验适用前提

  1. 实验数据通常假设是成对的来自正态分布的总体
  2. 实验数据之前的差距不能太大
  3. 每组样本之间是相互独立的

八、Spearman相关系数

在matlab中的定义:等级之间的皮尔逊相关系数,如下图

person系数,数学建模,数学建模


九、Spearman相关系数假设检验 

小样本情况下(n ≤ 30):直接查下图临界表即可

  1. person系数,数学建模,数学建模

大样本情况下:,为算出的斯皮尔曼相关系数,n表示样本数量,我们计算出检验值,并求出对应的p值与0.05相比即可。如下图:person系数,数学建模,数学建模


十、两者适用性

  1. 连续数据、正态分布、线性关系,用person系数最为恰当,效率比spearman高
  2. 上述任一条件不满足,就用spearman相关系数,不用person相关系数
  3. 两个定序数据之间也使用spearman相关系数,不用person相关系数

相关完整的配套代码和完整文档,可以关注后私信我免费领取文章来源地址https://www.toymoban.com/news/detail-738665.html

到了这里,关于数学建模冲国奖之——Person相关系数和Spearman相关系数的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数学建模-典型相关分析

    上节回顾 论文:常州大学一等奖淡水养殖… 要进行 pearson 相关系数 画散点图、折线图看是否相关 检验正态分布 满足上述,利用pearson相关系数 刚开始推导不会没关系,会应用就行,推导过程略,之后学习了后续知识,回过头来看就懂了 标度:数值 有序:优良差等 名义:男

    2024年02月16日
    浏览(55)
  • 数学建模:相关性分析

    🔆 文章首发于我的个人博客:欢迎大佬们来逛逛 Pearson Spearman Kendall tua-b t检验(t-test)临界值表-t检验表.xls T检验代码: myTtest005.m 相关性分析及SPSS软件操作.pdf

    2024年02月09日
    浏览(40)
  • 典型相关分析——数学建模清风笔记

    典型相关分析(Canonical Correlation analysis)研究两组变量(每组变量中都可能有多个指标)之间相关关系的一种多元统计方法。 它能够揭示出两组变量之间的内在联系。 典型相关分析目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性

    2024年02月19日
    浏览(43)
  • 数学建模.皮尔逊相关系数

    一.前言 皮尔逊相关系数说白了就是一次函数中的斜率k,反应两个变量之间的关系,与斜率不同的地方在于其数值在1和-1之间,越接近于1,则说明两个变量之间是完全正向的线性关系;越接近于-1,说明两个变量之间是完全负向的线性关系。(本文是作者在学习清风的建模网课

    2024年02月01日
    浏览(51)
  • Matlab数学建模-典型相关分析

    典型相关分析是研究两个多变量(向量)之间之间的线性相关关系,能够揭示出两组变量之间的内在联系。 CCA(典型相关分析) 在一元统计分析中,用相关系数来衡量两个随机变量的线性相关关系,用复相关系数研究一个随机变量与多个随机变量的线性相关关系。然而,这些方

    2024年02月10日
    浏览(58)
  • 数学建模学习笔记(20)典型相关分析

    典型相关分析概述 :研究两组变量(每组变量都可能有多个指标)之间的相关关系的一种多元统计方法,能够揭示两组变量之间的内在联系。 典型相关分析的思想 :把多个变量和多个变量之间的相关化为两个具有代表性的变量之间的相关性。对于一组变量来说,最简单的代

    2024年02月10日
    浏览(40)
  • 数学建模-相关性分析(Matlab)

     注意:代码文件仅供参考,一定不要直接用于自己的数模论文中 国赛对于论文的查重要求非常严格,代码雷同也算作抄袭 如何修改代码避免查重的方法:https://www.bilibili.com/video/av59423231   //清风数学建模 连续数据、正态分布、线性关系三者同时满足优先用。 一般处理这种

    2024年02月07日
    浏览(45)
  • 数学建模学习笔记-皮尔逊相关系数

    内容:皮尔逊相关系数 一.概念:是一个和线性线关的相关性系数 1.协方差概念: 协方差受到量纲的影响因此需要剔除 2.相关性的误区 根据这个结论,我们在计算该系数之前需要确定是否为线性函数 二.相关性的计算 1.Matlab:只含相关性不含假设检验:下面第三大点讲解假设

    2024年02月20日
    浏览(44)
  • 数学建模.皮尔逊相关系数假设检验

    一、步骤 查表找临界值 二、更好的方法 三、使用条件 作图可以使用spss 这个图对不对还不好说,因为还没进行正态分布的验证 四、正态分布验证 (1)JB检验 所以之前的数据的那个表是错的,因为不满足正态分布 (2)Shapiro-wilk检验 看最后一列,为p值,由此观之,不符合原

    2024年01月18日
    浏览(47)
  • 机器学习参数|数学建模|自相关性

    目录 1.定义和影响 1.1自相关性产生的原因 1.2自相关的后果 2.减小影响方法 2.1如何判断数据存在自相关性 a.用相关计量软件 b.Durbin-Watson Statistics(德宾-瓦特逊检验) c.Q-Statistics 以(box-pierce)- Eviews(7th version第七版本)为例子 2.2如何减弱模型的自相关性 a.GLS or FGLS b.HAC:Heteroscedastici

    2024年02月09日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包