Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

这篇具有很好参考价值的文章主要介绍了Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1 固定效应模型概念(Fixed Effects Model)

1.1  stata命令

1.1.1 LSDV法(Least squares dummy variable)

1.1.2 固定效应模型(Fixed Effects Model)

1.1.3 命令比较(reg、xtreg、areg、reghdfe)

1.2  固定效应模型选择——F检验 

1.2.1单因素效应直接看P值

1.2.2双向效应检验(时点效应)

2 随机效应模型(Random Effects Model)

3 混合效应模型(Mixed Effects Model) 

——选择使用混合回归还是随机效应

4 豪斯曼检验——个体效应与随机效应选择

5 代码整合

 6 出现的问题及解决方法


1 固定效应模型概念(Fixed Effects Model)

在面板数据线性回归模型中, 如果对于不同的截面或不同的时间序列, 只是模型的截距项是不同的, 而模型的斜率系数是相同的, 则称此模型为固定效应模型。 固定效应模型分为三类:

1.个体固定效应模型:对于不同的纵剖面时间序列(个体) 只有截距项不同的模型

2.时点固定效应模型:对于不同的截面(时点) 有不同截距的模型。

3.时点个体固定效应模型(双向效应模型):对于不同的截面(时点)、 不同的时间序列(个体) 都有不同截距模型。

模型中加入一系列虚拟变量作为控制变量以达到控制某些特征的目的,这些虚拟变量就叫做固定效应。比如加行业固定效应、年份固定效应、地区固定效应,实则都是加入一连串的行业/年份/地区虚拟变量作为控制变量,以达到对行业/年份/地区特征的控制。

1.1  stata命令

1.1.1 LSDV法(Least squares dummy variable)

* LSDV法
reg y x controls i.industry i.year, cluster(stkcd) // 以“i.”形式加入一系列虚拟变量,但是不生成这些虚拟变量。模型存在双因素效应
reg y x controls i.stkcd, cluster(stkcd) // 模型存在个体效应
reg y x controls i.year, cluster(stkcd) // 模型存在时间效应
xi: reg y x controls i.stkcd i.year, cluster(stkcd) // 加入xi,就是在加入虚拟变量的基础上还会创建这些虚拟变量,个人一般不用。

* 组内估计法
xtset industry year // 需要先设定面板数据
xtreg y x controls i.year, fe robust // fe代表固定效应模型

* 其他方法
areg、reghdfe等

对于时间效应,如果样本是以天为单位的股票数据,day的范围跨越了365天,用LSDV就会生成364个虚拟变量,导致结果十分冗长,此时可以用固定效应模型(2.2)来解决这一问题。

因为数据往往存在异方差、自相关等问题,导致估计的标准误不准确,所以我们会使用稳健标准误来替代原始标准误。如代码中使用的**robust(异方差稳健标准误) 和 cluster(聚类文件标准误)**代表的是采用稳健标准误的不同形式。

其中reg+cluster(stkcd) 等价于 xtreg,fe + robust,是目前论文中常用的比较稳健的标准误了,同样,也是比较难显著。稳健和显著很难两全。
 

1.1.2 固定效应模型(Fixed Effects Model)

  • 截面数据:

模型:Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

reg y x controls i.industry, robust
  • 混合截面数据

模型:Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

(xi:) reg y x controls i.industry i.year,robust
  • 面板数据(固定效应模型)

——个体固定:Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

——双向固定:Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

* 法1 xtreg
xtset id year  //需要先定义面板数据
xtreg y x controls, fe robust  //单因素个体效应
xtreg y x controls, fe i(year) robust // 单因素时间效应模型
xtreg y x controls i.year, fe robust  //双向效应模型

* 法2 reghdfe
reghdfe y x controls, absorb(id, year)

 实例:

xtset industry year  //需要先定义面板数据 行业,年份

//被解释变量:lnQ8,解释变量:Q,控制变量:lnQ6 lnQ7
//个体效应和时间效应的固定效应(双向效应)
xtreg lnQ8 Q lnQ6 lnQ7 i.year, fe robust  
//固定industry,个体效应
xtreg lnQ8 Q lnQ6 lnQ7 , fe robust

双向效应结果:

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

(行业)个体效应结果:

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)​ 

1.1.3 命令比较(reg、xtreg、areg、reghdfe)

三种命令自变量结果t值和系数都是一样的,区别就在于结果报告的冗长程度。

——reg(普通估计)

  • reg最为朴实无华,会全部报告。无论需要控制什么固定效应,直接往模型中以控制变量形式加入即可,Stata均会报告其回归系数。想知道被个体固定效应吸收掉的变量的估计系数用reg

——reghdfe(多维估计)

  • reghdfe主要用于实现多维固定效应线性回归。
  • 有些时候,我们需要控制多个维度(如城市-行业-年度)的固定效应, 此时,areg的absorb选项中只能加入一个固定效应,如果要加入更多固定效应,除非只能以i.形式加入控制变量,但是这样就与reg、xtreg一样,显的冗余了,且运行速度会很慢;
  • reghdfe解决的就是这一痛点,其在运行速度方面远远优于xtreg等命令。

——xtreg, fe(组内估计)

  • xtreg, fe是固定效应模型的官方命令,使用这一命令估计出来的系数是最为纯正的固定效应估计量(组内估计量)
  • 在使用xtreg命令之前,首先需要使用xtset命令进行面板数据声明,定义截面(个体)维度和时间维度;
  • xtreg实现个体固定效应估计必须要跟fe,如果不跟fe,默认为采用随机效应模型进行估计(re)
  • 对于不随时间变化的个体异质性都会被fe吸收,比如SOE一般不随时间变化,个体固定效应实际上已经包含了SOE的信息,所以采用xtreg, fe后,SOE将会出现“omit”,表示由于多重共线性被自动省略了。
  • 如果要额外控制其他固定效应,必须要在控制变量中加入该效应,比如我需要额外控制年份、地区,命令应当写为:
xtreg invest mvalue kstock i.province i.year, fe

1.2  固定效应模型选择——F检验 

1.2.1单因素效应直接看P值

在固定效应模型结果最下方,有显示的F值和P值,如P=0.0000<0.05,拒绝原假设→适用固定效应模型。

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

1.2.2双向效应检验(时点效应)

双因素效应结果最下方的P值代表个体效应,仅能用于判断是否存在个体效应。

使用stata命令testparm,检验所有的时间虚拟变量系数是否都为0。如下,P=0.0000<0.05,拒绝原假设,即存在时点效应。

testparm i.year  //检验所有的时间虚拟变量系数是否都为0

结果 

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

2 随机效应模型(Random Effects Model)

  随机效应模型认为误差项和解释变量不相关,而固定效应模型认为误差项和解释变量是相关的。

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

 xtreg lnQ8 Q lnQ6 lnQ7 i.year, re robust

3 混合效应模型(Mixed Effects Model) 

各个截面估计方程的 截距和斜率项都一样 

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

//vce(cluster year)表示以“year"为聚类变量的聚类稳健标准误
reg lnQ8 Q lnQ6 lnQ7,vce(cluster year)
est sto OLS

 Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

——选择使用混合回归还是随机效应

xttest0
reg lnQ8 Q lnQ6 lnQ7,vce(cluster year)  //混合效应模型
est sto OLS

xtreg lnQ8 Q lnQ6 lnQ7 i.year, re  //随机效应模型
est store re

xttest0

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

 检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型

  • 将三个模型结果放到一起
est table OLS fe re

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

4 豪斯曼检验——个体效应与随机效应选择

原假设是随机效应和固定效应无差异,如果拒绝原假设,则采用固定效应模型,否则为随机效应模型。

由于传统的豪斯曼检验假设球形扰动项,故在进行固定效应与随机效应的估计时,均不使用异方差或聚类稳健的标准误。“constant”表示在比较系数估计值时包括常数项(默认不包括常数项)

xtreg lnQ8 Q lnQ6 lnQ7 , fe  //个体固定效应
est store fe  //储存命名为fe

xtreg lnQ8 Q lnQ6 lnQ7 , re  //随机效应
est store re  //储存命名为re

hausman fe re,constant //豪斯曼检验

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

由于p指为0.0000,故拒绝原假设,认为应该使用固定效应模型,而非随机效应模型。

注:计算出的 s q r t ( d i a g ( V b − V B ) ) sqrt(diag(V_b-V_B)) sqrt(diag(Vb​−VB​))可能为负。说明的模型设定有问题,导致Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等。

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

可以改用hausman检验的其他形式:hausman fe, sigmaless选项,表示统一使用随机效应估计量的方差估计,可以减少出现负值的可能性。

hausman fe re,constant sigmamore

Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

5 代码整合

xtset industry year // 需要先设定面板数据

xtreg lnQ8 Q lnQ6 lnQ7 , re  //随机效应模型
est store re  //储存命名为re

reg lnQ8 Q lnQ6 lnQ7,vce(cluster year)  //混合效应模型
est sto OLS  储存命名为OLS
xttest0  //随机效应模型与混合效应模型选择

xtreg lnQ8 Q lnQ6 lnQ7 , fe  //个体固定效应
est store fe  //储存命名为fe

hausman fe re,constant //豪斯曼检验,选择个体固定效应还是随机效应模型

est table OLS fe re  //将三个模型结果整合在一起

 6 出现的问题及解决方法

导入面板数据时出现的问题1

repeated time values within panel

解决方法1

destring industry,replace
duplicates report industry year
duplicates list industry year
duplicates drop  industry year , force
Duplicates in terms of industry year

xtset industry year

 导入面板数据时出现的问题2

warning: existing panel variable is not year

 解决方法2

xtreg y dig lntalent IE scal gov, fe i.year robust

 导入面板数据时出现的问题3

command xtest is unrecognized

 解决方法3

use http://www.stata-press.com/data/r15/nlswork.dta
xtset idcode year, yearly

本文参考:02 固定效应模型与Stata实现_黑百椰的博客-CSDN博客_stata固定效应

【Python+Stata】豪斯曼检验:固定效应or随机效应?_Python for Finance的博客-CSDN博客_stata 豪斯曼检验文章来源地址https://www.toymoban.com/news/detail-455175.html

到了这里,关于Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • GPT与R语言回归模型(lm&glm)、混合效应模型、多元统计分析

    自2022年GPT(Generative Pre-trained Transformer)大语言模型的发布以来,它以其卓越的自然语言处理能力和广泛的应用潜力,在学术界和工业界掀起了一场革命。在短短一年多的时间里,GPT已经在多个领域展现出其独特的价值,特别是在数据统计分析领域。GPT的介入为数据处理、模

    2024年04月10日
    浏览(36)
  • R语言混合效应(多水平/层次/嵌套)模型及贝叶斯实现技术应用

    回归分析是科学研究中十分重要的数据分析工具。随着现代统计技术发展,回归分析方法得到了极大改进。混合效应模型(Mixed effect model),即多水平模(Multilevel model)/分层模型(Hierarchical Model)/嵌套模型(Nested Model),无疑是现代回归分析中应用最为广泛的统计模型,代表了现

    2023年04月22日
    浏览(42)
  • 数字普惠金融对城乡收入差距的影响——基于python的固定效应经济计量实证模型

    “共同富裕”是我们的共同目标,实现城乡发展的均衡,不断缩小城乡收入差距应是共同富裕的必由之路。当前,我国城乡差距有不断扩大的趋势,严重影响了我国经济的可持续发展。而随着数字化技术的不断普及,为实现城乡均衡发展提供了新的手段。依托数字化技术建立

    2024年02月19日
    浏览(36)
  • 数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据...

    本教程为读者提供了使用频率学派的广义线性模型(GLM)的基本介绍。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法 ( 点击文末“阅读原文”获取完整 代码数据 )。 本教程使用教育数据例子进行模型的应用。此外,本

    2024年02月16日
    浏览(43)
  • 【Python】(2022.07.03)在Jupyter Notebook中调用Stata17并绘制3D图展示回归结果的边际效应

    主要目的是因为stata里边编程的灵活性较之Python要差不少,如果把两个结合起来可以大大提高效率,Stata17中提供了良好的Stata与Python的交互。在Stata官网上提供了相应的介绍,我的安装也主要遵循了Stata官网上的说明 结合stata官网的说明,我们首先需要安装stata_setup这个包,注

    2023年04月08日
    浏览(41)
  • 论文笔记|固定效应的解释和使用

    DeHaan E. Using and interpreting fixed effects models[J]. Available at SSRN 3699777, 2021. 虽然固定效应在金融经济学研究中无处不在,但许多研究人员对作用的了解有限。 这篇论文解释了固定效应如何消除遗漏变量偏差并影响标准误差,并讨论了使用固定效应回归时的常见陷阱 。特别 关注在

    2024年02月09日
    浏览(31)
  • 因果推断系列16-面板数据与固定效应

    加载第三方包

    2024年02月05日
    浏览(39)
  • 环境混合物总体效应:加权分位数和回归(WQS)

    加权分位数和(Weighted Quantile Sum, WQS)回归是一种在环境暴露中常见的高维数据集的多元回归的统计模型。该模型允许通过有监督的方式构建一个加权指数,以评估环境暴露的总体效应以及混合物中每一个成分对总体效应的贡献。 首先若某一类环境混合物中共有i个component,将每

    2024年02月01日
    浏览(41)
  • 计量经济学及Stata应用 5.12 多元回归的Stata实例

    Number of obs :样本容量N F(n,N):F统计量,自由度为k(约束条件)、m(N-K)——检验整个方程的联合显著性 ProbF:F统计值对应的P值(0.0000:极小概率事件,显著;0.1,解释方程基本没用,设计有问题不显著) R-squared:所有的解释变量(x)可以解释y的变得约有R2%的变动(可以由x解

    2023年04月22日
    浏览(38)
  • R语言nlme、nlmer、lme4用(非)线性混合模型non-linear mixed model分析藻类数据实例...

    混合线性模型,又名多层线性模型(Hierarchical linear model)。它比较适合处理嵌套设计(nested)的实验和调查研究数据 ( 点击文末“阅读原文”获取完整 代码数据 )。 相关视频 此外,它还特别适合处理带有被试内变量的实验和调查数据,因为该模型不需要假设样本之间测量独立

    2024年02月10日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包