【数学建模】——相关系数

这篇具有很好参考价值的文章主要介绍了【数学建模】——相关系数。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第一部分:皮尔逊相关系数的计算以及数据的描述性统计

本讲我们将介绍两种最为常见的相关系数:皮尔逊person相关系数和斯皮尔曼spearman等级相关系数。它们可以用来衡量两个变量之间的相关性的大小,根据数组满足的不同条件,我们要选择不同的相关性系数进行行计算和分析(建模论文中最容易用错的方法)。

总体和样本:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

总体皮尔逊相关系数:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

皮尔逊相关系数中各专业术语的公式/定义:

总体皮尔逊相关系数:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

样本皮尔逊相关系数(分母变为了n-1)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab


相关性可视化图(spss版):【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

关于皮尔逊相关系数的一些理解误区:(在我们使用皮尔逊系数前买两个变量本身必须满足线性的关系)

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

(在使用皮尔逊相关系数前我们可以提前绘制散点图来判断是否符合线性关系)

对相关系大小的解释:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

列题:求八年级女生体测各数据之间的相关性:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

解法1:利用matlab来求解各项数据之间的关系

(matlab中求各项数据用到的函数)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

代码实现:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

将得出的数据结果存入excel表中:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

解法2:用spss软件

a.导入数据【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

b.数据统计

分析->描述->ctrl+a(全选)->选项(统计内容)->确定->等待生成数据图【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

皮尔逊相关系数(R)的计算:

a:matlab中有专门计算相关系数的函数corrcoef函数

R=corrcoef(传入的数据)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

美化相关系数表:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

将数据导入excel中

1调整行高,字体大小,字体位置(居中),列宽,小数点保留四位

2设置成便于观察的有色表格:开始->条件格式->色阶(随便选择一个都可以,上图中选择的红-白-蓝)->规则类型->编辑格式规则->最小值->数字->-1,中间值->数字->0->最大值->数字->1.【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

b:利用spss软件可以生成相关系数图

步骤:图形->旧对话框->散点图/点图->矩阵散点图->定义->ctrl+a(全选)导入矩阵变量->确定

生成图像:  【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

                                                                                 

第二部分:假设检验

  1. 第一步:零假设(H0):我们要验证或者推翻的假设,默认为所观察到的现象是由随机原因引起的,没有任何真实的效应或者关联。在这种情况下,我们可以假设没有校园交通事故与电动车超速之间的关联,即H0:电动车超速与校园交通事故无关。
  2. 备择假设(H1):对零假设的补充或者反面假设,表示我们想要证明的观察结果是由真实效应引起的。在这种情况下,备择假设可以是H1:电动车超速与校园交通事故有关。
  3. 显著性水平(α):代表我们在假设检验中所接受的错误率的界限。常见的显著性水平包括0.050.01。选择适当的显著性水平取决于研究的目的以及行业的标准。
  4. 检验统计量:根据研究问题和数据类型选择适当的检验统计量。对于校园交通事故与电动车超速之间的关系,可以使用统计方法(如卡方检验或者回归分析)来评估两者之间的相关性。
  5. 计算p值:根据所选择的检验统计量和样本数据计算出实际观察到的统计量的概率(即p值)。p值表示在零假设下观察到与实际观察到的统计量相同或更极端结果的概率。
  6. 做出决策:根据计算得到的p值与显著性水平进行比较,如果p值小于显著性水平,则拒绝零假设,认为结果具有统计显著性,支持备择假设。如果p值大于显著性水平,则无法拒绝零假设,无法得出结论。

需要注意的是,假设检验是一种统计推断方法,结果并不总是能得出确定的结论,而是提供了针对零假设的证据。此外,假设检验的可靠性还取决于采集的样本数据的质量、样本容量以及其他假设前提的满足程度。因此,在进行假设检验时,需要谨慎解释结果并综合考虑其他相关因素。【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

P值若小于我们假设的α则说明我们拒绝我们的零假设。

若p值大于则说明我们无法拒绝我们的零假设。【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

在假设检验中,我们可以使用单侧检验或双侧检验来评估零假设的可行性。这两种检验方法的选择取决于研究问题和预期效应的方向。

  1. 单侧检验(One-tailed test):在单侧检验中,我们关注的是假设效应在一个方向上是否显著。单侧检验适用于我们有明确的理论依据或研究目的,希望验证或推断效应的方向。例如,我们研究一种新药物是否能够显著降低血压,我们只关心药物对血压的降低是否显著,而不关心是否会增加血压。在单侧检验中,显著性水平(α)只存在于一个尾部。
  2. 双侧检验(Two-tailed test):在双侧检验中,我们关注的是假设效应在两个方向上是否显著。双侧检验适用于我们对效应的方向没有明确的预期,只想确定是否存在显著的效应。例如,我们研究一种新的教学方法是否能够显著提高学生的成绩,但我们不确定这种方法会显著提高还是显著降低学生成绩。在双侧检验中,显著性水平(α)在两个尾部进行比较。

在进行单侧检验或双侧检验时,我们需要计算得到的检验统计量与相应的临界值进行比较。对于单侧检验,我们只关注一个尾部的临界值;而对于双侧检验,我们要考虑两个尾部的临界值。如果计算得到的检验统计量在临界值范围内或小于显著性水平(α),则可以拒绝零假设,认为结果具有统计显著性。

需要注意的是,在选择单侧检验还是双侧检验时,要根据研究问题和预期效应来确定。如果有明确的预期效应方向,可以选择单侧检验;如果没有明确的预期效应方向,可以选择双侧检验。

(上图中就是单侧检验)

双侧检验的p值比较是需要×2再去比较:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

                                                           

第三部分:皮尔逊相关系数假设检验

对相关系数大小的解释:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

对皮尔逊相关系数进行假设检验:

步骤:

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

Matlab中求临界值:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

更好的判断方法P值判断法:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

matlab中求p值:

corrcoef有两个接收值的时候第一个为相关性,第二个为p值【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

单侧:1-累计密度函数tcdf(x值,自由值)

双侧:单侧结果*2

显著性标记:一般p值<0.01***,p>0.01&&p<0.05**,p>0.05&&p<0.1* 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

计算各列之间的相关系数以及p值【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

也可以用spss计算p值更加方便: 

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

生成已经标记好的图像(spss中一般最多标记两个*):【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

                                                                            

第四部分皮尔逊相关系数假设性检验的条件

正态分布JB检验(大样本n>30)

定义:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

偏度和峰度:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

Matlab中JB检验的函数:(但是matlab中的jb检验只能按列检验,所以需要利用循环将将数据中的元素按列检验,得到每列的检验结果)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

代码实现(检验数据:八年级女生体测):

%JB检验

%jbtest只能每次按列求

[h,p] = jbtest(S(:,1),0.05);%参数为正态分布,alpha(阿尔法)

[h,p] = jbtest(S(:,1),0.01);

%每列进行jb检验

[r,c] = size(S)

%提前开辟好相应的矩阵空间方便节省时间

H = zeros(1,c);

P = zeros(1,c);

%因为每次jb检验只能检验一列,所以利用for循环检验所有数据

for i=1:c

[h,p] = jbtest(S(:,i),0.05)

H(i) = h;

P(i) = p;

end

disp(H)

disp(P)

运行结果:

H是检验自己的零假设是否成立,返回0则成立返回1则不成立

P的值过小则返回0.01(可看成0)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

夏皮洛-威尔克检验(小样本3<=n<=50):

利用spss软件检验【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

检验结果:

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

Q-Q图检验正态分布

看数据点是否都落在直线上,若有偏差的话则不符合正态分布(只能按列检验生成相应的QQ图)

Matlab中的QQ图函数:

qqplot(数据)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

在spss中可以直接全部显示所有列的qq图:

(在夏洛皮及检验方法中就会生成qq图)【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

                                                                                  

第五部分:斯皮尔曼相关系数

定义:

斯皮尔曼相关系数是利用数据在经过排序后的在数据在的序号用来检验,通过计算得到R

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

斯皮尔曼的两种方法:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

代码实现:【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

也可以用spss生成:

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

斯皮尔相关系数与皮尔逊相关系数的对比:

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

斯皮尔曼相关系数的假设检验:

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

Matlab中斯皮尔假设检验的函数:

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

两个相关系数的总结与对比:

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

我们得到一组数据后可以先利用spss检验是否符合正态分布

分析->描述统计->探索-->导入数据-->图-->含检验的正态图

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 【数学建模】——相关系数,数学建模,数学建模,机器学习,人工智能,算法,matlab

 

若P值>0.05,服从正态分布

若P值<0.05,不服从正态分布

故结论:两个数据都不服从正态分布

本篇文章中八年级女生体测数据代码参考:

clear;clc
%S为女生数据,B为男生数据
load 相关性系数\girl_data.mat
%统计描述
MIN = min(S);%最小值
MAX = max(S);%最大值
MEAN = mean(S);%均值
MEDIAN = median(S);%中位数值
SKEWNESS = skewness(S);%偏度
KURTOSIS = kurtosis(S);%峰度
STD = std(S);%标准差
Result = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD];

%计算各列之间的相关系数R,P值 
[R,P] = corrcoef(S);
%通过P值判断法进行相关性检验
P<0.01 %标记三颗星
(P>0.01) .* (P<0.05);%标记两颗星
(P>0.05) .* (P<0.10);%标记一颗星
%构建一个随机的正态分布
x = normrnd(2,3,100);
%求其偏度
skewness(x);
%求其峰度
kurtosis(x);
%JB检验
%jbtest只能每次按列求
[h,p] = jbtest(S(:,1),0.05);%参数为正态分布,alpha(阿尔法)
[h,p] = jbtest(S(:,1),0.01);
%每列进行jb检验
[r,c] = size(S)
%提前开辟好相应的矩阵空间方便节省时间
H = zeros(1,c);
P = zeros(1,c);
%因为每次jb检验只能检验一列,所以利用for循环检验所有数据
for i=1:c
[h,p] = jbtest(S(:,i),0.05);
H(i) = h;
P(i) = p;
end
disp('H:')
disp(H)
disp('P:')
disp(P)
qqplot(S(:,1))
%~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
%通过斯皮尔曼系数求男生数据
%求男生体测数据的列和行
[l,h] = size(B);
%利用斯皮尔曼相关系数求[相关性,显著性(p值)]
[R2,P2] = corr(B,'type','Spearman')

  博主主要跟着清风数学建模的课程学习,其中里面的一些图片都来源于上课视频的截图。文章来源地址https://www.toymoban.com/news/detail-579267.html

到了这里,关于【数学建模】——相关系数的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数学建模冲国奖之——Person相关系数和Spearman相关系数

      目录 一、简介 二、Person相关系数 三、相关性可视化 四、皮尔逊相关系数的理解误区 五、对皮尔逊相关系数的两点总结 六、Person系数习题 七、Person系数假设检验适用前提 八、Spearman相关系数 九、Spearman相关系数假设检验  十、两者适用性 本讲我们介绍两种最常用的相关

    2024年02月06日
    浏览(28)
  • 数学建模.皮尔逊相关系数假设检验

    一、步骤 查表找临界值 二、更好的方法 三、使用条件 作图可以使用spss 这个图对不对还不好说,因为还没进行正态分布的验证 四、正态分布验证 (1)JB检验 所以之前的数据的那个表是错的,因为不满足正态分布 (2)Shapiro-wilk检验 看最后一列,为p值,由此观之,不符合原

    2024年01月18日
    浏览(35)
  • 【数学建模】皮尔逊相关系数和假设检验

    为了说明两组数据之间的相关性,例如身高与50米跑步的成绩,我们引入相关系数,本文先介绍person相关系数以及在特定情况下的使用方法。 Person相关系数在 满足特定条件下 用来衡量两个变量之间的相关性。 在正式介绍person相关系数之前,我们先引入协方差的概念 协方差是

    2024年02月09日
    浏览(28)
  • 机器学习参数|数学建模|自相关性

    目录 1.定义和影响 1.1自相关性产生的原因 1.2自相关的后果 2.减小影响方法 2.1如何判断数据存在自相关性 a.用相关计量软件 b.Durbin-Watson Statistics(德宾-瓦特逊检验) c.Q-Statistics 以(box-pierce)- Eviews(7th version第七版本)为例子 2.2如何减弱模型的自相关性 a.GLS or FGLS b.HAC:Heteroscedastici

    2024年02月09日
    浏览(29)
  • 数学建模【基于清风】:相关系数法与多元线性回归

    个人理解为:如果当X增加时,Y趋向于减少,斯皮尔曼,皮尔逊相关系数则为负。斯皮尔曼,皮尔逊相关系数为零表明当X增加时Y没有任何趋向性。当X和Y越来越接近完全的单调相关时,斯皮尔曼相关系数会在绝对值上增加。 如 但是,对于相关系数来说,相关系数的大小与其

    2024年02月08日
    浏览(29)
  • OLS回归模型-斯皮尔曼相关系数-数值模拟-多目标规划-养老服务床位需求预测与运营模式研究-之数学建模

    数学建模 -OLS回归模型 斯皮尔曼相关系数 数值模拟 多目标规划-养老服务床位需求预测与运营模式研究 养老服务床位需求预测与运营模式研究 摘要         随着时间的推移,我国人口老龄化逐渐增多,老龄化的社会问题越来越突出,从2009年到2018年,无论是老年人口数量

    2024年02月09日
    浏览(33)
  • 数学建模:变异系数法

    🔆 文章首发于我的个人博客:欢迎大佬们来逛逛 变异系数法的设计原理是: 若某项指标的 数值差异较大 ,能明确区分开各被评价对象,说明该指标的分辨信息丰富,因而应给该指标以 较大的权重 ; 若某项指标的 数值差异较小 ,那么这项指标区分各评价对象的能力较弱

    2024年02月11日
    浏览(32)
  • 数学建模学习笔记(20)典型相关分析

    典型相关分析概述 :研究两组变量(每组变量都可能有多个指标)之间的相关关系的一种多元统计方法,能够揭示两组变量之间的内在联系。 典型相关分析的思想 :把多个变量和多个变量之间的相关化为两个具有代表性的变量之间的相关性。对于一组变量来说,最简单的代

    2024年02月10日
    浏览(28)
  • 数学建模 | MATLAB数据建模方法--机器学习方法

    近年来,全国赛的题目中,多多少少都有些数据,而且数据量总体来说呈不断增加的趋势, 这是由于在科研界和工业界已积累了比较丰富的数据,伴随大数据概念的兴起及机器学习技术的发展, 这些数据需要转化成更有意义的知识或模型。 所以在建模比赛中, 只要数据量还

    2024年02月03日
    浏览(54)
  • J1.数学建模 & Python机器学习介绍

    命令行:代码执行的地方 脚本文件(.m):敲代码的地方 实时脚本文件(.mlx):代码执行结果和代码放在一起,可以插入图片…类似小word 运行节:实时脚本文件的功能,可以分区运行代码(蓝色条),类似脚本文件的断点 函数文件调用function 符号: 注释使用 % 分号;在代

    2024年04月27日
    浏览(23)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包