斯皮尔曼(spearman)相关系数python代码实现

这篇具有很好参考价值的文章主要介绍了斯皮尔曼(spearman)相关系数python代码实现。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

简介

斯皮尔曼等级相关系数(简称等级相关系数,或称秩相关系数,英语:Spearman's rank correlation coefficient或Spearman's ρ)。一般用python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档或者python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档表示。它是衡量两个变量的相关性的无母数指标。它利用单调函数评价两个统计变量的相关性。若数据中没有重复值,且当两变量完全单调相关时,斯皮尔曼相关系数为+1或−1,而且python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档位于-1到1之间python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档如图所示。

更常用的一般为这个公式,但是比较麻烦。一般我们直接调用scipy.stats.spearman()直接调用。

python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档

备注:当所有的等级数值都为整数时,可以通过以下简单的公式计算等级相关系数。

python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档

斯皮尔曼(等级)系数主要是针对X,Y两个变量求相关性

适用范围

  1. 用于当数据不满足下列条件任意一个(线性关系,连续数据,正态分布)的时候

  1. 当数据为定序数据的时候

定序数据为反应登记的数据,代表了某种逻辑顺序,而且属于品质数据,(甲,乙,丙)(优,良,差)等类型都可以称为定序数据。

补充spearman系数数据排序

备注:如果变量数据相同的话,我们采取依次顺序排序,相同数值取位置的平均值

python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档

具体代码

import numpy as np
import pandas as pd
import scipy.stats as stats
def calculate_spearman_correlation(X, Y):
    return stats.spearmanr(X, Y)[0]
def calculate_spearman_correlation_p(X, Y):
    return stats.spearmanr(X, Y)[1]
if __name__=='__main__':
    x = [1, 2, 3, 4, 5, 6, 7, 8, 9]
    y = [2, 1, 2, 4.5, 7, 6.5, 6, 9, 9.5]
    print(calculate_spearman_correlation_p(x, y))
    print(calculate_spearman_correlation(x, y))

spearman检验

小样本检验(n<30)

在一般情况下,我们通过直接适用查表的方式进行验证,即为spearman系数要大于表中对应的临界值。即为我们认为我们的相关系数大于表中的临界值,我们认为相关系数是有显著性差异的,即为有相关性而且相关性不为0

python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档

大样本检验(n>30)

在一般情况下,我们通过构造统计量进行假设检验,假设检验如图,而且在统计量python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档,如果统计量python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档符合正态分布,具体公式如图所示。

H0: python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档
H1: python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档

python 斯皮尔曼等级相关系数,数学建模,学习,经验分享,Powered by 金山文档(构造的统计量符合正态分布)

计算p值,如果p值大于0.05,即为证明有显著差异。即为有相关性,相关系数不为0。文章来源地址https://www.toymoban.com/news/detail-802187.html

求P值代码

def calculate_spearman_correlation_p(X, Y):
    return stats.spearmanr(X, Y)[1]

到了这里,关于斯皮尔曼(spearman)相关系数python代码实现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • matlab相关性分析(皮尔逊,肯德尔,斯皮尔曼)

    https://zhuanlan.zhihu.com/p/449099421 https://ww2.mathworks.cn/help/matlab/ref/heatmap.html

    2024年02月09日
    浏览(30)
  • python数据处理——计算相关系数矩阵(Spearman)

    计算相关系数矩阵,原始数据如下: 计算相关系数矩阵代码如下: 计算结果保存到工作表,打开结果如下:  

    2024年02月16日
    浏览(32)
  • Pearson相关系数和Spearman相关系数的区别

      参考资料前两个博客讲解的非常详细,因本人想要自己梳理下,才有此文,请直接跳转即可。 (1)简单来说   协方差:变量具有 同增、同减 的趋势。趋势越接近,则相关性越大,反之越小。   相关系数:协方差的标准化,把数值控制在[-1,1]的区间表示。方便比较

    2023年04月14日
    浏览(29)
  • 数学建模冲国奖之——Person相关系数和Spearman相关系数

      目录 一、简介 二、Person相关系数 三、相关性可视化 四、皮尔逊相关系数的理解误区 五、对皮尔逊相关系数的两点总结 六、Person系数习题 七、Person系数假设检验适用前提 八、Spearman相关系数 九、Spearman相关系数假设检验  十、两者适用性 本讲我们介绍两种最常用的相关

    2024年02月06日
    浏览(27)
  • 三大统计学相关系数(pearson、kendall、spearman)

    前边文章讲了很多了,这里不详细讲了,想了解的可以看这篇。 相似度计算(2)——皮尔逊相关系数 适用范围: 当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:   (1) 两个变量之间是线性关系,都是连续数据。   (2) 两个变量的总体是正

    2024年02月12日
    浏览(26)
  • 相关性分析-Pearson, Spearman, Kendall 三大相关系数+绘制热力图

    Pearson, Spearman, Kendall 三类相关系数是统计学上的三大重要相关系数,表示两个变量之间变化的趋势方向和趋势程度。下面对这三类系数做简单的介绍。

    2024年04月09日
    浏览(36)
  • Spearman 相关性分析法,以及python的完整代码应用

    Spearman 相关性分析法是一种针对两个变量之间非线性关系的相关性计算方法,同时,它不对数据的分布进行假设。该方法的基本思想是将两个(也可以多个)变量的值进行排序,并计算它们之间的等级相关性(Spearman 相关系数)。Spearman 相关系数的范围在 -1 到 1 之间,取值为

    2024年02月09日
    浏览(31)
  • 【数模系列】02_三大相关系数+Python代码

    在统计学中,皮尔逊相关系数,是用于度量两个变量X和Y之间的相关( 线性相关 ),其值介于-1与1之间,其绝对值越大说明该两个变量越相关。 注意:该系数只能评价两个 线性变量 之间的相关性。 ①首先由Pearson相关系数的定义可知, ρ x , y = c o v ( X , Y ) σ X σ Y ρ_{x,y}=

    2024年02月09日
    浏览(26)
  • 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)

    相关性分析:指对两个或多个具有相关性的变量元素进行分析 相关系数最早是由统计学家卡尔 皮尔逊设计的统计指标,是研究变量之间线性相关承兑的值,一般用字母 r 表示。 Pearson相关系数是衡量两个数据集合是否在一条线上面,用于衡量变量间的线性关系。 这里是引用

    2024年02月05日
    浏览(29)
  • 协方差、样本协方差、协方差矩阵、相关系数详解(python代码)

    对于一个随机变量的分布特征,可以由均值、方差、标准差等进行描述。而对于两个随机变量的情况,有协方差和相关系数来描述两个随机变量的相互关系。 本文主要参考概率论与数理统计的教科书,整理了协方差、样本协方差、协方差矩阵、相关系数的概念解释和代码。

    2023年04月10日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包