控制变量--实践中的问题与观点

这篇具有很好参考价值的文章主要介绍了控制变量--实践中的问题与观点。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

控制变量

一、控制变量选择

1.1实践中控制变量选择

问题一:针对模型,怎么选控制变量?

问题二:如果拟合程度很高,R^2可以达到很高,是否还需要再加入控制变量了。 就是怎么判断加不加控制变量,然后控制变量加到什么程度?

针对一&二回答:高级计量专家:控制变量也是解释变量,一般来说应该要有理论支持或假设,还要看估计结果才决定加不加,与R方关系不大,主要要看变量显著性;

1.2 理论上的控制变量选择

好的控制变量的筛选,首先一定是与解释变量相关的,但是一定不能与解释变量具有因果关系,要不然会产生内生性,因此在选控制变量是要注意内生性问题,注意控制变量与解释变量的完全共线性问题。具体而言,1.我们需要控制的是混淆因素。例如X对于Y的研究,需控制对X与Y都有影响Z,2.不能控制中介因素,即:X对Y的研究中,X能直接影响Y,也可以通过Z影响Y,此时控制住Z,则会切断系数路径,导致估计系数有偏,3.不能控制对撞因素,即现研究X对Z 的影响,但X和Z对Y均有影响,会表现为Y与X和Z都相关,但是此时不能控制Y,因为Y为X与Z的一个结果变量,在讨论X与Z直接影响,控制Y不变的影响是不可能做到的,因此如果控制了Y,研究结果也会出现悖论。

1.3拟合优度的理解:

1.拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。

2.度量拟合优度的指标:判定系数(可决系数)R2

实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档

二、 控制变量显著性

问题一:如果所选的控制变量的系数很多都不显著,意味着什么,模型还可用吗?

统计学导师观点:控制变量显著与否与研究模型关系不大,着重看解释变量与被解释变量显著性;

问题二:情况:控制变量系数不显著,而关键变量系数显著,此时的模型是否有效,如何处理模型,

统计学老师观点:关键变量系数显著预示着模型的可行性以及存在可应用的机会,但模型的有效性应该还有其他的评价指标或体系,因此并无法直接断定模型是否有效。

附:如果此时模型有效,是否应该按全模型系数去做预测

回答:做回归模型去预测是并未要求控制变量显著,是要求研究的解释变量显著,也即控制变量是否显著不需要关注。例如:在科研论文中,经济学大多论文连控制变量的系数都不会给出,因为控制变量并非论文研究的重要变量关系,它的意义仅仅是控制。

三、控制变量的公式理解

具体问题:(为什么要加上or减少控制变量)

3.1回归的研究定义:

需要研究某一现象和它的主要因素的关系,但又存在其他不确定因素,因此这是一种不确定关系。【即这个位置要明确一个X一个Y(一元回归)or多个X一个Y(多元回归)】

注意:此时已经明确了研究的主要变量以及被研究的变量

实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档
实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档
实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档
实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档

四、加减控制变量程序问题

问题:会不会出现加入控制变量后,主要自变量由显著变成不显著的情况呢?如果出现了,怎么处理合适呢?

4.1理论分析

新加入控制变量的情形:

情形 1:与控制变量之间完全独立,则加入控制变量对估计系数无影响

实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档

情形 2:与控制变量之间相关,且完全通过控制变量的"途径"来影响被解释变量,则估计系数不显著

实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档

情形 3:与控制变量之间高度相关,则加入控制变量后,估计系数都不显著

实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档

情形 4:与控制变量之间相关,则加入控制变量后,主要解释变量的估计系数会出现大小和符号变化。具体变化取决于与控制变量间的正负相关性。

实证分析中控制变量怎么选,机器学习,python,人工智能,Powered by 金山文档

4.2解决方法

通常遇到多重共线问题常见的解决方法有:

1.直接删除高度共线的某一变量

这样做简单粗暴,但是面临一个问题是,删掉的变量是否构成遗漏变量问题,这是需要仔细考虑。

2.合并

利用主成分分析将两个共线的变量通过正交分解进行合并。

注意:控制变量显著不显著并不重要

4.3.观点(实践意义)

高级计量老师:

当控制变量也是解释变量,一般来说,加入控制变量不太会导致主要解释变量不显著。但如果多重共线性严重可能会导致不显著。

空间计量老师:

如果出现加入控制变量后,主要自变量由显著变成不显著的情况,那就证明前面的逻辑分析有问题,控制变量没选好,重新选。

4.4.总结

总结来看:虽然该问题存在理论可能,但是在统计实践中,如果前面的工作不出现大的错误,是很难遇见此问题,遇见此问题时,更应该反省与检车之前的变量选择与构建工作。文章来源地址https://www.toymoban.com/news/detail-795690.html

到了这里,关于控制变量--实践中的问题与观点的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 嵌入式编程实践——怎么用STM32实现LLC电路控制(附代码示例)?

    STM32是意法半导体(STMicroelectronics)推出的一系列32位ARM Cortex-M微控制器产品线。它们广泛应用于嵌入式系统中,包括工业控制、汽车电子、智能家居、医疗设备等领域。STM32系列微控制器具有高性能、低功耗、丰富的外设接口和强大的开发生态系统等特点。LLC电路控制是一项

    2024年04月16日
    浏览(120)
  • 在控制理论里,单个输入变量被施加了饱和特性处理,那么后续怎么利用李雅普诺夫判据判断系统稳定性呢?

    在控制理论中,当一个系统的输入变量被施加了饱和特性(即输入被限制在某个范围内),系统的稳定性分析可能变得更复杂。使用李雅普诺夫方法判断这样的系统稳定性通常需要考虑非线性特性。下面是如何使用李雅普诺夫方法进行稳定性分析的步骤,以及如何在LabVIEW中进

    2024年01月19日
    浏览(46)
  • 关于shell中的一个命名引起的问题,局部变量

    以下脚本并不完整,只是抽取的部分进行 问题讲解。。 片段分析 主要留意idd_serial,实际这是一个全局变量,在函数外依然可以被正常访问。 上述逻辑主要是通过udevadm来提取 /dev/srN对应的 ID_SERIAL, PC端共存在/dev/sr0和/dev/sr1两个光驱驱动。 首先,我们删除/dev/sr0和/dev/sr1,,

    2024年02月12日
    浏览(47)
  • 【案例实践】R语言多元数据统计分析在生态环境中的实践应用

    查看原文R语言生物群落分析绘图、多元统计分析、CMIP6、遥感碳储量、GEE林业、InVEST等 生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是

    2023年04月12日
    浏览(49)
  • 【Go学习】Ginkgo测试框架学习实践 + 问题记录 + 怎么解决(0)

    1、ginkgo测试框架介绍:https://onsi.github.io/ginkgo/ 2、重点是学习实践 + 问题记录 + 怎么解决 3、送福利:国内好用的ChatGpt有很多,比如:天工、文心一言、讯飞星火、通义万相等 1. 安装 2. 使用 (1)安装正确的话,在当前目录的平行目录下应该会有一个新增的bin目录,目录下有

    2024年01月24日
    浏览(38)
  • Unity中修改脚本中的变量初始值,但在Unity中不更新的问题

    问题描述: 在脚本中声明了一个public的类成员变量,并赋初值,运行过几次后赋予一个新的初始值,但是Inspector中依然显示旧的值,使用Debug.Log输出该值,依然为旧值。或者有一种情况是虽然给该变量赋了初始值,但是在Inspector中该变量值为0。 原因解释: C#是面向对象的语

    2024年02月16日
    浏览(34)
  • Eviews用向量自回归模型VAR实证分析公路交通通车里程与经济发展GDP协整关系时间序列数据和脉冲响应可视化...

    河源市是国务院1988年1月7日批准设立的地级市,为了深入研究河源市公路交通与经济发展的关系,本文选取了1988-2014年河源市建市以来24年的地区生产总值(GDP)和公路通车里程(GL)的时间序列数据,其中公路通车里程(GL)用来反映河源市公路交通发展状况,地区生产总

    2024年02月09日
    浏览(53)
  • 数据分析在程序员职业中的重要性及实践应用

    在当今信息化社会的快速发展中,数据分析已经成为一项重要的职业技能。不论是从事哪个行业,都需要具备一定的数据分析能力。对于程序员而言,掌握数据分析技能不仅能够提升自身在职场中的竞争力,更能够在职业生涯中获得更多的发展机会。本文将围绕数据分析在程

    2024年02月07日
    浏览(53)
  • 应用部署引起上游服务抖动问题分析及优化实践方案

    作者:京东物流 朱永昌 本文主要围绕应用部署引起上游服务抖动问题展开,结合百川分流系统实例,提供分析、解决思路,并提供一套切实可行的实践方案。 百川分流系统作为交易订单中心的专用网关,为交易订单中心提供统一的对外标准服务(包括接单、修改、取消、回

    2023年04月14日
    浏览(74)
  • GaussDB(DWS)中的分布式死锁问题实践

    本文分享自华为云社区《GaussDB(DWS)中的分布式死锁问题实践》,作者: 他强由他强 。 分布式死锁是相对于单机死锁而言,一个事务块中的语句,可能会分散在集群里多个节点(CN/DN)执行,在不同节点上可能都会持有锁,当并发事务进行时可能会导致分布式(全局)死锁,

    2024年02月04日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包