多元线性回归分析(Stata)

这篇具有很好参考价值的文章主要介绍了多元线性回归分析(Stata)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  本文借鉴了数学建模清风老师的课件与思路,可以点击查看链接查看清风老师视频讲解:清风数学建模:https://www.bilibili.com/video/BV1DW411s7wi

注:本节所有代码 在 regress_stata.do 文件里,复习的时候直接去运行里面的代码即可。

文章内容有点多,可以直接看最后的个人总结。

目录

一、前言

二、回归分析简介

 三、数据的简介

3.1 数据的分类

 3.2 数据的收集

四、对数据的处理

五、内生性的探究

六、分类变量的设置

七、案例背景

八、Stata实现多元线性回归

8.1 Stata基础

​编辑8.2 Stata里进行描述性统计分析

8.3 案例第1问求解

8.3.1 不加入分类变量时的回归

8.3.2 加入分类变量时的回归

8.3.3 关于调整后R^2值太小怎么办

8.4 案例第2问求解

 九、论文点评

9.1 一篇错误很多的论文《基于多元回归模型的大学生期末数学成绩影响因素探究》点评

9.2 清风的毕业论文点评

十、异方差(回归之前检验数据是否存在异方差)

10.1 异方差介绍

10.2 检验异方差

10.2.1 图形检验​编辑

 10.2.2 假设检验

10.3 异方差的处理方法

十一、多重共线性(回归结束后用)

11.1 多重共线性介绍

11.2 多重共线性检验

​编辑 11.3 多重共线性的处理方法

十二、逐步回归

12.1 逐步回归简介

12.2 Stata实现逐步回归

 12.3 逐步回归说明

十三、个人总结


一、前言

stata多元线性回归,数学建模,matlab

二、回归分析简介

stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab 该问题可通过后文提到的标准化回归解决。

stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

 三、数据的简介

3.1 数据的分类

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

 3.2 数据的收集

stata多元线性回归,数学建模,matlab

四、对数据的处理

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

 详见《Excel对数据进行预处理》文件。

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

五、内生性的探究

注意:内生性在实际操作时不是很重要,这个问题太难解决了,所以在数模中一般不考虑这个问题,此处只是说明一下有这个东西。

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

六、分类变量的设置

stata多元线性回归,数学建模,matlab

在Stata里操作时,会自动设置对照组,即在由分类变量生成的虚拟变量里随机设置一个为对照组,从而避免多重共线性的影响。 

stata多元线性回归,数学建模,matlab

七、案例背景

stata多元线性回归,数学建模,matlab

八、Stata实现多元线性回归

8.1 Stata基础

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

8.2 Stata里进行描述性统计分析

stata多元线性回归,数学建模,matlab

 这里的数据为连续性数据,得到的结果在可以Excel里优化一下再放入论文中。

stata多元线性回归,数学建模,matlab

 这里的数据为分类数据,tab命令可以得到分类数据的频数分布表,gen命令可以对该分类变量生成虚拟变量。

stata多元线性回归,数学建模,matlab

 可将该指标总体情况放入论文中。

8.3 案例第1问求解

8.3.1 不加入分类变量时的回归

stata多元线性回归,数学建模,matlab

 这里只用了两个自变量进行演示。

其中,第一个表里,联合显著性检验=0<0.05代表在95%的置信水平下(这里看你自己定为95%还是90%),拒绝原假设,模型通过了联合显著性检验,所以该线性模型才是有意义的。调整后的R^2为0.0346,这里因为是对其进行分析而不是预测,所以可不用关注R^2,在预测的时候再重点关注即可。

第二个表里,Coef一列为两个指标的回归系数。团购价的P值是在t检验下得到的,表示在95%的置信水平下,有一个自变量(团购价)是显著的,-35.39873代表在其他自变量不变的情况下,当团购价平均每增加1元,就会导致评价量平均减少35.39873,商品毛重该变量不显著,故不对其进行分析;_cons为常数项,也是显著的。

在回归之后,可以通过下面的命令将回归的结果保存到一个word里(详见stata里操作),其中,*** p<0.01  ** p<0.05 * p<0.1分别为在99%,95%,90%的置信水平下显著。

regress 评价量 团购价元 商品毛重kg
// 下面的语句可帮助我们把回归结果保存在Word文档中
// 在使用之前需要运行下面这个代码来安装下这个功能包(运行一次之后就可以注释掉了)
// ssc install reg2docx, all replace
// 如果安装出现connection timed out的错误,可以尝试换成手机热点联网,如果手机热点也不能下载,就不用这个命令吧,可以自己做一个回归结果表,如果觉得麻烦就直接把回归结果截图。
est store m1
reg2docx m1 using m1.docx, replace
// *** p<0.01  ** p<0.05 * p<0.1

word里的结果如下:

stata多元线性回归,数学建模,matlab

8.3.2 加入分类变量时的回归

stata多元线性回归,数学建模,matlab

这里Stata自动对多重共线性问题进行解决,即在分类变量里随机设置 一组对照组。

结果如下:

stata多元线性回归,数学建模,matlab

 完整图见Stata里操作。和上面的没加入分类变量时的操作步骤类似,分析是一样的,说明联合显著性检验、调整后的R^2、回归系数和P值即可。

第一个表里,联合显著性检验=0<0.05代表在95%的置信水平下,拒绝原假设,模型通过了联合显著性检验,所以该线性模型是有意义的。

第二个表里,Coef一列为两个指标的回归系数(这里可以参考Excel作图这篇文章里的对回归系数显不显著作可视化处理放入论文中)。团购价的P值是在t检验下得到的,表示在90%的置信水平下,自变量团购价和F1(分类=牛奶粉)是显著的,-29.77274代表在其他自变量不变的情况下,当团购价平均每增加1元,就会导致评价量平均减少29.77274, 14894.55代表在其他自变量不变的情况下,分类为牛奶粉的评价量比羊奶粉(因为羊奶粉为对照组)的评价量平均高出29.77274。

8.3.3 关于调整后R^2值太小怎么办

stata多元线性回归,数学建模,matlab

 在论文中放入调整后R^2时,可以将调整后R^2的介绍放进去。

8.4 案例第2问求解

stata多元线性回归,数学建模,matlab

所谓的标准化回归就是在对数据标准化后再使用回归。

stata多元线性回归,数学建模,matlab

关于回归结果的可视化见  柱状图可视化回归结果

 九、论文点评

9.1 一篇错误很多的论文《基于多元回归模型的大学生期末数学成绩影响因素探究》点评

stata多元线性回归,数学建模,matlab

其中,期末成绩为y,其他四个变量为x。

stata多元线性回归,数学建模,matlab

 这里并没有对回归系数说明各自为多少,R^2也不是相关系数,是拟合优度,显著性也没告诉。在数据归一化后,在对回归系数解释那里就不好说了。

也不用加入平方项,只是对数据进行分析,不用这么复杂,如果是预测的话还行,加入平方项之后也不好解释。

数据也不用进行归一化。

stata多元线性回归,数学建模,matlab

 这里就和上面案例第二问一样,求哪个x对影响最大,这里可以直接用标准化回归系数。

9.2 清风的毕业论文点评

stata多元线性回归,数学建模,matlab

详见清风的论文和答辩PPT。一定要去看!!!

十、异方差(回归之前检验数据是否存在异方差)

10.1 异方差介绍

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

10.2 检验异方差

两种检验方法,一种是用图像进行检验,一种是假设检验,图像检验不太准确,假设检验里一般用怀特检验,所以个人认为可以结合图形检验和怀特检验,这样更具有说服力。

10.2.1 图形检验stata多元线性回归,数学建模,matlab

这里是通过绘制残差图来看,但并不严谨。图1为残差与拟合值的散点图,在拟合值较小时数据几乎没有波动,变大时波动就很明显,故数据存在异方差;图2为残差与自变量x(这里x可以随机给)的散点图,在团购价较小时,波动很大,而当团购价变大时,波动较小,故数据存在异方差。

stata保存图片的命令见  regress_stata

 stata多元线性回归,数学建模,matlab

 10.2.2 假设检验

(1)BP检验

stata多元线性回归,数学建模,matlab

 stata多元线性回归,数学建模,matlab

 (2)怀特检验(推荐使用这个检验)

stata多元线性回归,数学建模,matlab

这里,P值为0.0054, 是显著的,所以拒绝原假设,即扰动项存在异方差。

10.3 异方差的处理方法

stata多元线性回归,数学建模,matlab

 可以将蓝色字体写入论文中,然后使用第一种方法。

stata多元线性回归,数学建模,matlab

十一、多重共线性(回归结束后用)

11.1 多重共线性介绍

stata多元线性回归,数学建模,matlab

 前文提到的完全多重共线性Stata会自动帮我们解决。红色框起来的为多重共线性带来的问题。

11.2 多重共线性检验

 11.3 多重共线性的处理方法

stata多元线性回归,数学建模,matlab

(1):如果回归是用来预测的话,可以不管多重共线性,只管R^2即可。

(2):如果只关心回归系数也不用管。

(3):关心变量即核心解释变量,可以尝试删除这些变量。

十二、逐步回归

12.1 逐步回归简介

stata多元线性回归,数学建模,matlab

 使用向后逐步回归就行。

12.2 Stata实现逐步回归

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

 因为逐步回归不能有完全多重共线性,所以运行该数据时报错了,解决方法为:前面运行的回归Stata检测出了哪些变量为完全多重共线性的,此时只需剔除这些变量再重新运行即可。

stata多元线性回归,数学建模,matlab

stata多元线性回归,数学建模,matlab

 上面两图为Stata里向前、向后逐步回归的演示,可以看出,在剔除了那些有多重共线性的变量后,现在这些都是显著的了。

 12.3 逐步回归说明

stata多元线性回归,数学建模,matlab

 (2)是针对要发期刊,论文的情况,在数模中可以忽略,使用的时候就用向后逐步回归就行,然后分析显著的变量。

十三、个人总结

在对数据进行回归之前(最小二乘回归)要检验数据是否存在异方差(检验异方差可以综合图形检验和怀特检验,这样更具有说服力),但是在Stata里是需要先回归之后才能检验异方差,不过也问题不大,若存在则需要用OLS+稳健的标准误。

在回归完之后要进行多重共线性检验(不是完全多重共线性,完全多重共线性Stata里已经帮我们解决了,即在由分类变量生成的虚拟变量里随机设置一个为对照组),若存在,则可以采用向后逐步回归(将存在多重共线性的变量剔除,然后进行逐步回归)。文章来源地址https://www.toymoban.com/news/detail-855846.html

到了这里,关于多元线性回归分析(Stata)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数学建模学习笔记(9)多元线性回归分析(非常详细)

    回归分析的地位 :数据分析中最基础也是最重要的分析工作,绝大多数的数据分析问题都可以使用回归的思想来解决。 回归分析的任务 :通过研究自变量和因变量的相关关系,尝试用自变量来解释因变量的形成机制,从而达到通过自变量去预测因变量的目的。具体如下:

    2024年02月03日
    浏览(44)
  • 计量经济学及Stata应用 5.12 多元回归的Stata实例

    Number of obs :样本容量N F(n,N):F统计量,自由度为k(约束条件)、m(N-K)——检验整个方程的联合显著性 ProbF:F统计值对应的P值(0.0000:极小概率事件,显著;0.1,解释方程基本没用,设计有问题不显著) R-squared:所有的解释变量(x)可以解释y的变得约有R2%的变动(可以由x解

    2023年04月22日
    浏览(38)
  • 数学建模-多元线性回归笔记

    1.学模型✅ 2.看专题论文并复习算法 多元线性回归 无偏性:预测值与真实值非常接近 一致性:样本量无限增大,收敛于待估计参数的真值 如何做:控制核心解释变量和u不相关 四类模型回归系数的解释 截距项不用考虑 一元线性回归:y = a + bx + u x每增加1个单位,y平均变化

    2024年02月12日
    浏览(37)
  • 数学建模matlab实现多元线性回归

            多元线性回归是统计学中一种常用的回归分析方法,用于研究多个自变量对一个连续因变量的关系。它基于线性假设,假设因变量与自变量之间存在线性关系。         在多元线性回归中,我们考虑多个自变量的影响,并试图找到一条最佳拟合直线(或超平面

    2024年02月02日
    浏览(44)
  • 【数学建模】多元线性回归(Python&Matlab代码实现)

    目录 1 概述 2 算例1 2.1 算例 2.2 Python代码实现  2.3 结果 3 算例2  3.1 算例 3.2 Python代码 3.3 结果 4 算例3 4.1 算例 4.2 Python代码 4.3 结果 5 算例4——Matlab代码实现 5.1 算例 5.2 Matlab代码实现 5.3 结果  6 写在最后 一元线性回归模型研究的是一个因变量与一个自变量之间呈直线趋势的

    2023年04月15日
    浏览(46)
  • 数学建模【基于清风】:相关系数法与多元线性回归

    个人理解为:如果当X增加时,Y趋向于减少,斯皮尔曼,皮尔逊相关系数则为负。斯皮尔曼,皮尔逊相关系数为零表明当X增加时Y没有任何趋向性。当X和Y越来越接近完全的单调相关时,斯皮尔曼相关系数会在绝对值上增加。 如 但是,对于相关系数来说,相关系数的大小与其

    2024年02月08日
    浏览(57)
  • stata基础--回归,画散点图,异质性分析

    代码: sysuse auto sysuse dir       /*可以看到所有的数据*/ su price mpg foreign reg price mpg predict u,residual       /* 新变量u=每一个观测的残差*/                                    /*生成残差u需要紧接着回归*/ mpg和price在0.01显著性水平上负相关。 经验回归方程:

    2024年02月01日
    浏览(30)
  • 数学建模常用模型(五):多元回归模型

    由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。所以在遇到有些无法用机理分析建立数学模型的时候,通常采取搜集大量数据的办法,基于对数据的统计分析去建立模型,其中用途最为广泛的一类随

    2024年02月13日
    浏览(42)
  • Stata 回归结果详解

    使用stata自带的auto数据, 被解释变量(因变量):price(价格) 解释变量(自变量):mpg(里程)、rep78(1978年后的修理记录)、weight(重量)、length(长度)、foreign(本土/国外品牌) 回归结果分两部分,上半部分为回归结果的总体描述信息,下半部分为具体变量信息。

    2024年02月03日
    浏览(33)
  • 空间面板回归模型(stata操作)

    此检验主要检验所研究的变量(或被解释变量)是否存在空间依赖性。首先利用各省份地区的位置坐标使用stata构造空间权重矩阵(距离矩阵),然后导入stata中。 还可画出莫兰分布图 结果如下: 通过P值可知,被解释变量在各8年中存在着空间依赖性,所以继续进行空间模型

    2024年04月15日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包