控制变量
一、控制变量选择
1.1实践中控制变量选择
问题一:针对模型,怎么选控制变量?
问题二:如果拟合程度很高,R^2可以达到很高,是否还需要再加入控制变量了。 就是怎么判断加不加控制变量,然后控制变量加到什么程度?
针对一&二回答:高级计量专家:控制变量也是解释变量,一般来说应该要有理论支持或假设,还要看估计结果才决定加不加,与R方关系不大,主要要看变量显著性;
1.2 理论上的控制变量选择
好的控制变量的筛选,首先一定是与解释变量相关的,但是一定不能与解释变量具有因果关系,要不然会产生内生性,因此在选控制变量是要注意内生性问题,注意控制变量与解释变量的完全共线性问题。具体而言,1.我们需要控制的是混淆因素。例如X对于Y的研究,需控制对X与Y都有影响Z,2.不能控制中介因素,即:X对Y的研究中,X能直接影响Y,也可以通过Z影响Y,此时控制住Z,则会切断系数路径,导致估计系数有偏,3.不能控制对撞因素,即现研究X对Z 的影响,但X和Z对Y均有影响,会表现为Y与X和Z都相关,但是此时不能控制Y,因为Y为X与Z的一个结果变量,在讨论X与Z直接影响,控制Y不变的影响是不可能做到的,因此如果控制了Y,研究结果也会出现悖论。
1.3拟合优度的理解:
1.拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。
2.度量拟合优度的指标:判定系数(可决系数)R2
二、 控制变量显著性
问题一:如果所选的控制变量的系数很多都不显著,意味着什么,模型还可用吗?
统计学导师观点:控制变量显著与否与研究模型关系不大,着重看解释变量与被解释变量显著性;
问题二:情况:控制变量系数不显著,而关键变量系数显著,此时的模型是否有效,如何处理模型,
统计学老师观点:关键变量系数显著预示着模型的可行性以及存在可应用的机会,但模型的有效性应该还有其他的评价指标或体系,因此并无法直接断定模型是否有效。
附:如果此时模型有效,是否应该按全模型系数去做预测
回答:做回归模型去预测是并未要求控制变量显著,是要求研究的解释变量显著,也即控制变量是否显著不需要关注。例如:在科研论文中,经济学大多论文连控制变量的系数都不会给出,因为控制变量并非论文研究的重要变量关系,它的意义仅仅是控制。
三、控制变量的公式理解
具体问题:(为什么要加上or减少控制变量)
3.1回归的研究定义:
需要研究某一现象和它的主要因素的关系,但又存在其他不确定因素,因此这是一种不确定关系。【即这个位置要明确一个X一个Y(一元回归)or多个X一个Y(多元回归)】
注意:此时已经明确了研究的主要变量以及被研究的变量
四、加减控制变量程序问题
问题:会不会出现加入控制变量后,主要自变量由显著变成不显著的情况呢?如果出现了,怎么处理合适呢?
4.1理论分析
新加入控制变量的情形:
情形 1:与控制变量之间完全独立,则加入控制变量对估计系数无影响
情形 2:与控制变量之间相关,且完全通过控制变量的"途径"来影响被解释变量,则估计系数不显著
情形 3:与控制变量之间高度相关,则加入控制变量后,估计系数都不显著
情形 4:与控制变量之间相关,则加入控制变量后,主要解释变量的估计系数会出现大小和符号变化。具体变化取决于与控制变量间的正负相关性。
4.2解决方法
通常遇到多重共线问题常见的解决方法有:
1.直接删除高度共线的某一变量
这样做简单粗暴,但是面临一个问题是,删掉的变量是否构成遗漏变量问题,这是需要仔细考虑。
2.合并
利用主成分分析将两个共线的变量通过正交分解进行合并。
注意:控制变量显著不显著并不重要
4.3.观点(实践意义)
高级计量老师:
当控制变量也是解释变量,一般来说,加入控制变量不太会导致主要解释变量不显著。但如果多重共线性严重可能会导致不显著。
空间计量老师:
如果出现加入控制变量后,主要自变量由显著变成不显著的情况,那就证明前面的逻辑分析有问题,控制变量没选好,重新选。文章来源:https://www.toymoban.com/news/detail-795690.html
4.4.总结
总结来看:虽然该问题存在理论可能,但是在统计实践中,如果前面的工作不出现大的错误,是很难遇见此问题,遇见此问题时,更应该反省与检车之前的变量选择与构建工作。文章来源地址https://www.toymoban.com/news/detail-795690.html
到了这里,关于控制变量--实践中的问题与观点的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!