Stata | 分组回归系数差异性检验

这篇具有很好参考价值的文章主要介绍了Stata | 分组回归系数差异性检验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

这篇博客介绍的是在两个样本组的模型设定是一样的情形下,进行分组回归后,比较相同变量中二者在系数大小上是否显著差异。如果系数差异显著,则说明二者在经济意义上显著差异。

因为我们常常使用的数据是面板数据,并且,我们常常由于控制很多固定效应,导致在进行系数差异性检验碰壁,所以本篇博客是在基于公司面板数据为例,假设探讨薪酬激励(x)是否有助于提升企业业绩(y),并控制企业特征变量($z),添加了年份(year)、行业(ind)、公司(firm)固定效应,并在公司层面聚类。

主回归模型如下:

reghdfe y x $z, absorb(year ind firm) vce(cluster firm) 

分组回归是探讨国有企业(state1)和非国有企业(state0)在薪酬激励(x)对企业业绩(y)回归系数是否有显著差异。

本文主要介绍如下几种方法:
I. 加入交乘项
II.基于 SUR 模型的检验
III.组合检验
IV.自己编写程序
V.手动计算

本文主要分享过程,不具体展开原理,具体参考如下资料
1、Stata: 如何检验分组回归后的组间系数差异?
2、同一个模型三组不同样本下,回归系数间的差异性检验
3、Stata:自己动手做组间系数差异检验-bootstrap-bdiff文章来源地址https://www.toymoban.com/news/detail-410804.html

I.加入交乘项

*-I.加入交乘项
//最严格的系数差异性检验:假设其他控制变量在两组之间的不存在系数差异
**生成交乘项变量
xtset stkcd year
gen x_state = x*state

**加入产权性质(state)和交乘项(x_state)进行回归
reghdfe y x state x_state $z, absorb(year ind firm) vce(cluster firm)  

II.基于 SUR 模型的检验

*-II.基于 SUR 模型的检验
//假设条件也比较宽松:回归时要保持二者回归变量一致,且固定效应多的时候需要去中心化(运行速度的考虑)
**固定效应处理
xtset stkcd year
tab year,gen(y_)  // 年度固定效应
tab ind,gen(i_)  // 行业固定效应

foreach var of varlist y x $z i_* y_* {	
	egen double `var'_0 = mean(`var'), by(firm)
	replace `var' = `var'-`var'_0 
	drop `var'_0 
	}  // 企业固定效应太多维,所以在企业层面进行去中心化来控制企业固定效应,加快运行速度
	
**分组回归并进行差异性检验
reg y x $z i_* y_*  if state==1
est store SOE

reg y x $z i_* y_*  if state==0
est store NonSOE

suest SOE NonSOE, vce (cluster firm)
test [SOE_mean]x=[NonSOE_mean]x

III.组合检验

*-III.组合检验
//条件最为宽松:原始样本是从母体中随机抽取的,适用于各种命令(reg、xtreg、logit、ivregress)

**-方式I
**固定效应处理
xtset stkcd year
tab year,gen(y_)  // 年度固定效应
tab ind,gen(i_)  // 行业固定效应

foreach var of varlist y x $z i_* y_* {	
	egen double `var'_0 = mean(`var'), by(firm)
	replace `var' = `var'-`var'_0 
	drop `var'_0 
	}  // 企业固定效应太多维,所以在企业层面进行去中心化来控制企业固定效应,加快运行速度
	
**分组回归并进行差异性检验
bdiff, group(state) model(xtreg y x $z i_* y_*, cluster(firm)) reps(1000) seed(10101) first detail 

**-方式II
xtset stkcd year
bdiff, group(state) model(reghdfe y x $z, absorb(year ind firm) vce(cluster firm)) reps(1000) seed(10101) first detail 

IV.自己编写程序

*-IV.自己编写程序
//基于bdiff的原理,进行撰写,可以灵活运用自己回归的方式
**编写程序
capture program drop bse
program bse, eclass
xtset stkcd year

**-分组回归
reghdfe y x $z if state==1, absorb(year indid firm) vce(cluster firm) 
scalar b1= _b[x]

reghdfe  y x $z if state==0, absorb(year indid firm) vce(cluster firm) 
scalar b2= _b[x]

**-计算组间系数差异
scalar diff= b1- b2
 
**-将组间系数差存储在矩阵中,设置列名方便调取
matrix b = diff
matrix colnames b = diff

**-将组间系数差矩阵返回 e() 中
ereturn post b
ereturn display
end

**运行程序进行检验
bse // 运行程序
bootstrap _b[diff], reps(500) seed(1234) saving(diff,replace) nowarn : bse // 循环500次抽样
use diff,clear
count if _bs_1>0
local num = r(N)
local p = `num'/_N
if `p'>0.5 {
	local p = 1-`p'
	}
dis "y:`p'" // 不对diff的分布进行预先假设来检验“H0:diff=0

V.手动计算

*-V.手动计算
**分组回归
xtset stkcd year

reghdfe y x $z if state==1, absorb(year indid firm) vce(cluster firm) 
est store SOE

reghdfe  y x $z if state==0, absorb(year indid firm) vce(cluster firm) 
est store NonSOE

**计算Z统计量
Z = (β1 = β2)/(Var(β1)+Var(β2))1/2  // (这里的1/2是指对(Var(β1)+Var(β2))开根号的意思!!!)
//其中β1 和 β2 是系数大小, Var(β1) 和Var(β2) 分别是两者的方差,更准确的写法是标准差(回归后系数的标准误)的平方,平方不好打出来,就用方差。

// 求出Z值后查Z统计量分布表,几个常用的临界值是Z=1.65对应p<0.1,Z=1.96对应p<0.05,Z=2.58对应p<0.01。如果你计算的Z值小于1.65,那连最宽松的p<0.1都不满足,无法说明两个系数具有显著差异。

//如果计算的z是负值,根据 P(-x)=1=p(x)

到了这里,关于Stata | 分组回归系数差异性检验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 一分钟理解:Blazor WebAssembly 和 Blazor Server 差异性

    Blazor是一个使用.NET生成交互式客户端Web UI的框架。Blazor使用Razor语法,用于将HTML标记与C#代码结合在一起,最后将C#代码文件和Razor文件统一编译为.NET程序集。 在Visual Studio开发环境中, 创建Blazor应用有两种托管方式: 1、Blazor WebAssembly ---- 创建Blazor应用的项目模板,在WebAs

    2024年02月13日
    浏览(46)
  • 面板数据协整检验(Stata)

    当时间序列数据存在非平稳性时,直接将经济变量进行回归可能产生伪回归问题。针对非平稳数据计量建模,首先要判定这些变量是否存在同阶单整,如果满足同阶单整,才有必要对这些变量进行协整检验。当所涉及的变量存在协整时,由这些变量构建的回归模型才有意义,

    2024年02月05日
    浏览(45)
  • Stata中异方差检验(代码直接食用)

    在线性回归模型的经典假设下,运用最小二乘法回归估计得到的才是最优线性无偏估计量(BLUE)。在实际问题中,完全满足基本假设的情况并不多,不满足的基本假设的情况下称为 基本假定违背 ,而 异方差 就是其中一种。 对于异方差的检验有很多种,这里我们介绍3种方法

    2024年02月02日
    浏览(47)
  • 实证论文复刻|stata安慰剂检验

    文章及代码来源:中国工业经济《税收征管数字化与企业内部薪酬差距》 目录 随机抽取对照组和实验组 随机设定政策时点 先po完整代码 接下来逐一解读: forvalue表示循环 sysuse表示使用xx数据,和use区别参考stata中 sysuse和use区别 - 知乎 简单来说use调用数据时,需要加上路径

    2024年02月15日
    浏览(45)
  • 空间权重矩阵与相关性检验(Stata)

    由于窗口限制,不能很好显示完整。 1.1 全局空间相关性检验 数据集test01是关于美国俄亥俄州哥伦布市的截面数据,hoval是房价,income表示收入,crime为犯罪率。下面进行全局空间自相关检验 1.2 局部空间自相关检验 1.3 散点图 2.1 截断距离权重矩阵 部分数据结构 转化的矩阵后

    2024年02月05日
    浏览(45)
  • 皮尔逊相关系数及假设检验

    一、看两者是否算相关要看两方面:显著水平以及相关系数 (1)显著水平,就是P值,这是首要的,因为如果不显著,相关系数再高也没用,可能只是因为偶然因素引起的,那么多少才算显著,一般p值小于0.05就是显著了;如果小于0.01就更显著;例如p值=0.001,就是很高的显著水平了,只要

    2024年02月08日
    浏览(51)
  • 数学建模.皮尔逊相关系数假设检验

    一、步骤 查表找临界值 二、更好的方法 三、使用条件 作图可以使用spss 这个图对不对还不好说,因为还没进行正态分布的验证 四、正态分布验证 (1)JB检验 所以之前的数据的那个表是错的,因为不满足正态分布 (2)Shapiro-wilk检验 看最后一列,为p值,由此观之,不符合原

    2024年01月18日
    浏览(47)
  • 【数学建模】皮尔逊相关系数和假设检验

    为了说明两组数据之间的相关性,例如身高与50米跑步的成绩,我们引入相关系数,本文先介绍person相关系数以及在特定情况下的使用方法。 Person相关系数在 满足特定条件下 用来衡量两个变量之间的相关性。 在正式介绍person相关系数之前,我们先引入协方差的概念 协方差是

    2024年02月09日
    浏览(38)
  • 相关系数及其假设检验——matlab及spss实现

    数学建模中,相关性分析往往是建模的前提。但是,相关系数是数学建模中最容易出错滥用的点,需要注意不同相关系数的使用条件。 (1)总体的Pearson相关系数  (2)样本的Pearson相关系数  (3)Pearson相关系数的误区: 理解误区1——散点图和皮尔逊相关系数的联系(垂直

    2024年02月03日
    浏览(38)
  • Stata 回归结果详解

    使用stata自带的auto数据, 被解释变量(因变量):price(价格) 解释变量(自变量):mpg(里程)、rep78(1978年后的修理记录)、weight(重量)、length(长度)、foreign(本土/国外品牌) 回归结果分两部分,上半部分为回归结果的总体描述信息,下半部分为具体变量信息。

    2024年02月03日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包