相关系数
相关系数含义
个人理解为:如果当X增加时,Y趋向于减少,斯皮尔曼,皮尔逊相关系数则为负。斯皮尔曼,皮尔逊相关系数为零表明当X增加时Y没有任何趋向性。当X和Y越来越接近完全的单调相关时,斯皮尔曼相关系数会在绝对值上增加。
如
但是,对于相关系数来说,相关系数的大小与其所呈关系不是充要关系,如
计算相关系数前的操作
1.计算相关系数前,要对数据进行描述性统计,事实上,不但是对相关系数,对于绝大部分数学建模,在对数据进行操作前,都应对数据进行一定的描述性统计
描述性统计步骤:可以利用SPSS,stata,excel,matlab等软件对数据进行描述性统计,个人比较推荐用spss,因为spss也算是数学建模比较常用的工具,而且对于初学者来说其操作难度明显低于matlab,但SPSS的问题就在于无法编程,灵活性较差
2.在进行相关性分析时,一定要先画矩阵散点图,确定存在线性关系再求相关系数
图片来源:清风数学建模
斯皮尔曼相关系数与皮尔逊相关系数
先说什么时候适合斯皮尔曼什么时候适合皮尔逊
皮尔逊相关系数求法
R = corrcoef(Test) % Test是待求矩阵
效果图
可以使用excel进行润色,生成色阶矩阵
皮尔逊系数进行假设检验
个人认为相关检验是相关性分析中比较重要的一步,而且所涉及的假设检验,显著性,p值的概念,也是后续进行一系列数学建模的基础,其实在相关系数这一章,进行假设检验的关键在于原假设和与之对立的假设到底是什么
其实规律就是p值若小于1-置信水平,则拒绝原假设,反之无法拒绝原假设
进行假设检验的条件
斯皮尔曼相关系数
语法;
% 直接给出相关系数和p值
[R,P]=corr(Test, 'type' , 'Spearman')
斯皮尔曼相关系数的假设检验
多元线性回归分析
数据分类
1.横截面数据:某一时间点不同对象的数据,如2018各省份GDP
2.时间序列数据:不同时间点,同一对象,如全国历年各地GDP
3.面板数据:以上两种结合,如2018-2020各省份GDP
线性回归注意事项
1.线性回归中“线性”两字仍是对参数来说的,而不是自变量
2.回归系数是需要解释的,如****解释时,应说:“在控制…不变的条件下”
3.注意内生性问题,具体解释就是最后得出的结果中扰动项是否与自变量有关,若有关,则有内生性问题,内生性问题最容易理解的影响就是会使参数估计不准
3.有关虚拟变量的问题
如有31个省份的变量,则虚拟变量的个数为30个,编号为1,2,3,4
…
4.论文尽量不要使用截图,容易被判为作弊
5.解释性回归一定要解释变量的含义,此时若对数据进行归一化则不好解释
回归语句
标准化回归教程
异方差问题
这个我也没有理解透彻,只能照搬大佬的了
看大佬原文
异方差检验语句
文章来源:https://www.toymoban.com/news/detail-479505.html
异方差解决办法
文章来源地址https://www.toymoban.com/news/detail-479505.html
到了这里,关于数学建模【基于清风】:相关系数法与多元线性回归的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!