理想的实验

这篇具有很好参考价值的文章主要介绍了理想的实验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.关于“问题”的问题

一项研究计划可以围绕四个基本问题(frequently asked questions,FAQ)展开:

  • 研究对象间的(因果)关系(relationship of interest)

这里更关注的是“因果关系”,谁是因,谁是果?
→班级规模对学生分数的影响
→教育水平对工资水平的因果效用,个体接受更多的教育所带来的工资增长量
→殖民地制度对经济增长的影响

  • 理想条件下的实验(ideal experiment)

理想条件下的实验通常是假设出来的
这个问题让我们思考如果能进行理想的实验,我们会怎样做。
这通常涉及到一种假设情况,我们可以完全控制并随机分配影响因果关系的所有潜在变量。这是一种理论上的设想,可以帮助我们设计实际的研究方法。

  • 识别策略(identification strategy)

研究人员如何运用观察数据(不是随机实验产生的数据)来逼近真实实验

  • 推断模型(mode of interest)

需要描述被研究的总体、所使用的样本以及构建标准误时所作的假设

这四个问题提供了一个从提出研究问题到设计实验,然后进行数据分析并得出结论的基本框架。在经济学和其他社会科学的研究中,这是一种非常有用的方法。

2.理想的实验

最可信和最有影响力的研究设计应该使用随机分配(random assignment)的方法

2.1 选择性偏误

研究问题:医院能让人变得更健康吗?
调查方法:全国健康采访调研

组别 样本大小 平均健康水平 标准误
去过医院 7774 3.21 0.014
没有去过医院 90049 3.93 0.003

从表格知道,两者之间的平均差距是0.72,没有去过医院的人健康状况更好,两者之差大且显著, t t t统计量为58.9。这个结果意味着去医院会使人健康状况变差。

事实真是如此吗? 去医院的人可能本身健康水平就比较差。人们去医院通常是因为他们生病或者有健康问题,而健康的人则不需要去医院。因此,当我们比较这两组人的健康状况时,我们实际上是在比较生病的人和健康的人,而不是比较去医院的效果。这个问题被称为选择性偏误,因为人们是否去医院是根据他们的健康状况来选择的,而这个选择可能与他们的健康状况相关。这使得我们很难确定去医院是否会改善人们的健康状况,因为我们不能确定健康状况的改变是由于去医院,还是由于他们本来就生病。

🔆解决这个问题的一种方法是使用随机化实验设计

  1. 个体 i i i是否接受医院治疗 D i = { 0 , 1 } D_i=\{0,1\} Di={0,1},个体 i i i的健康水平记为 Y i Y_i Yi。对于任何个体而言,他们的健康状况都有两种潜在结果:
    Y i = { Y 1 i if  D i > 0 Y 0 i if  D i = 0 = Y 0 i + ( Y 1 i − Y 0 i ) D i Y_i = \begin{cases} Y_{1i} & \text{if } D_i > 0 \\ Y_{0i} & \text{if } D_i = 0 \end{cases} = Y_{0i}+(Y_{1i}-Y_{0i})D_i Yi={Y1iY0iif Di>0if Di=0=Y0i+(Y1iY0i)Di
    也就是说,一个人没有去医院,他的健康状态是 Y 0 i Y_{0i} Y0i;一个人去医院接受了治疗,他的健康状态是 Y 1 i Y_{1i} Y1i。我们想知道的个体因果效应就是 Y 1 i − Y 0 i Y_{1i}-Y_{0i} Y1iY0i,这个值可以解释为个体 i i i在医院接受治疗对其健康状况产生的影响。【Rubin因果模型】

2.平均因果效应(average casual effect)
E [ Y i ∣ D i = 1 ] − E [ Y i ∣ D i = 0 ] = E [ Y 1 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 0 ] = E [ Y 1 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 1 ] + E [ Y 0 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 0 ] E[Y_i| D_i =1]-E[Y_i| D_i =0] \\ =E[Y_{1i}|D_i=1]-E[Y_{0i}|D_i=0] \\ =E[Y_{1i}|D_i=1]-E[Y_{0i}|D_i=1]+E[Y_{0i}|D_i=1]-E[Y_{0i}|D_i=0] E[YiDi=1]E[YiDi=0]=E[Y1iDi=1]E[Y0iDi=0]=E[Y1iDi=1]E[Y0iDi=1]+E[Y0iDi=1]E[Y0iDi=0]
其中, E [ Y 1 i ∣ D i = 1 ] E[Y_{1i}|D_i=1] E[Y1iDi=1]是接受住院治疗的人的平均健康水平, E [ Y 0 i ∣ D i = 1 ] E[Y_{0i}|D_i=1] E[Y0iDi=1]是如果接受住院治疗的人本来没有得到治疗,他们的健康水平。
E [ Y 1 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 1 ] E[Y_{1i}|D_i=1]-E[Y_{0i}|D_i=1] E[Y1iDi=1]E[Y0iDi=1]处理的平均因果效应

E [ Y 0 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 0 ] E[Y_{0i}|D_i=1]-E[Y_{0i}|D_i=0] E[Y0iDi=1]E[Y0iDi=0]选择性偏误。是去医院的接受治疗与不去医院接受治疗的人如果没有被治疗时的健康状况的平均差异。

2.2 用随机分配解决选择性偏误

补充:
随机分配处理是消除选择性偏误的一种方法,因为它可以确保处理组和控制组在其他所有相关特性上的分布是相同的。这意味着,任何观察到的结果差异都可以归因于处理,而不是混淆变量。更具体地说,当处理( D i D_i Di)是随机分配的,我们可以期望处理组和控制组在未观察到的特性上的平均值是相同的。

补充:
随机分配满足非混杂性:给定协变量 X i X_i Xi,对个体的干预分配独立于潜在结果,即
( Y 0 i , Y 1 i ) ⊥ D i ∣ X i (Y_{0i}, Y_{1i}) \perp D_i | X_i (Y0i,Y1i)DiXi
其中, ⊥ \perp 表示独立性, Y 0 i Y_{0i} Y0i Y 1 i Y_{1i} Y1i 是潜在结果, D i D_i Di 是处理指示符(例如,是否去医院), X i X_i Xi 是协变量向量(例如,个体的其他特性)。

D i D_i Di进行随机分配可以消除选择性偏误,因为随机分配使得 D i D_i Di独立于潜在结果。在数学上,这意味着

E [ Y 0 i ∣ D i = 1 ] = E [ Y 0 i ∣ D i = 0 ] E[Y_{0i}|D_i=1] = E[Y_{0i}|D_i=0] E[Y0iDi=1]=E[Y0iDi=0]

如果这个等式成立,那么选择性偏误就为0,因为选择性偏误被定义为

E [ Y 0 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 0 ] E[Y_{0i}|D_i=1] - E[Y_{0i}|D_i=0] E[Y0iDi=1]E[Y0iDi=0]

因此,当处理是随机分配的,可以得出

E [ Y i ∣ D i = 1 ] − E [ Y i ∣ D i = 0 ] = E [ Y 1 i ∣ D i = 1 ] − E [ Y 0 i ∣ D i = 1 ] = E [ Y 1 i − Y 0 i ∣ D i = 1 ] = E [ Y 1 i − Y 0 i ] E[Y_i|D_i=1]-E[Y_i|D_i=0]=E[Y_{1i}|D_i=1]-E[Y_{0i}|D_i=1] =E[Y_{1i}-Y_{0i}|D_i=1]=E[Y_{1i}-Y_{0i}] E[YiDi=1]E[YiDi=0]=E[Y1iDi=1]E[Y0iDi=1]=E[Y1iY0iDi=1]=E[Y1iY0i]

也就是说,处理的平均因果效应等于接受治疗和不接受治疗的个体的期望健康状况之差。这就允许我们直接估计平均因果效应,而无需担心选择性偏误的问题。

2.3 对实验的回归分析

Y i = β 0 + β 1 D i + ϵ i Y_i = \beta_0 + \beta_1 D_i + \epsilon_i Yi=β0+β1Di+ϵi
其中, β 0 = E ( Y 0 i ) \beta_0=E(Y_{0i}) β0=E(Y0i) β 1 = ( Y 1 i − Y 0 i ) \beta_1=(Y_{1i}-Y_{0i}) β1=(Y1iY0i) ϵ i \epsilon_i ϵi Y 0 i Y_{0i} Y0i的随机部分,即 ϵ i = Y 0 i − E ( Y 0 i ) \epsilon_i=Y_{0i}-E(Y_{0i}) ϵi=Y0iE(Y0i)

对上面这个等式求数学期望:
E [ Y i ∣ D i = 1 ] = β 0 + β 1 + E [ ϵ i ∣ D i = 1 ] E[Y_i|D_i=1]=\beta_0 + \beta_1+E[\epsilon_i|D_i=1] E[YiDi=1]=β0+β1+E[ϵiDi=1]
E [ Y i ∣ D i = 0 ] = β 0 + E [ ϵ i ∣ D i = 0 ] E[Y_i|D_i=0]=\beta_0 +E[\epsilon_i|D_i=0] E[YiDi=0]=β0+E[ϵiDi=0]
两式相减, E [ Y i ∣ D i = 1 ] − E [ Y i ∣ D i = 0 ] = β 1 + E [ ϵ i ∣ D i = 1 ] − E [ ϵ i ∣ D i = 0 ] E[Y_i|D_i=1]-E[Y_i|D_i=0]=\beta_1+E[\epsilon_i|D_i=1]-E[\epsilon_i|D_i=0] E[YiDi=1]E[YiDi=0]=β1+E[ϵiDi=1]E[ϵiDi=0]

β 1 \beta_1 β1是处理效应, E [ ϵ i ∣ D i = 1 ] − E [ ϵ i ∣ D i = 0 ] E[\epsilon_i|D_i=1]-E[\epsilon_i|D_i=0] E[ϵiDi=1]E[ϵiDi=0]是选择性偏误

因此,选择性偏误意味着回归残差项 ϵ i \epsilon_i ϵi和回归元 D i D_i Di之间存在着相关性。

在随机化实验中,由于处理的分配是随机的,我们可以直接使用这个简单的回归模型来估计平均因果效应,而无需控制其他协变量。然而,在观察性研究中,我们通常需要将模型扩展为多元回归模型,以控制可能的混淆变量。例如:
Y i = β 0 + β 1 D i + β 2 X i + ϵ i Y_i = \beta_0 + \beta_1 D_i + \beta_2 X_i + \epsilon_i Yi=β0+β1Di+β2Xi+ϵi
其中, X i X_i Xi 是一个或多个协变量。在这个模型中, β 1 \beta_1 β1 仍然是处理的平均因果效应,但现在这个效应是在控制了 X i X_i Xi 的影响之后得到的。文章来源地址https://www.toymoban.com/news/detail-488862.html

到了这里,关于理想的实验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 云计算——大模型应用发展的“理想支点”

    在数字化浪潮中,人工智能技术的突飞猛进为千行百业带来了前所未有的转型机遇。近期出现的Sora模型能够根据文本描述生成高质量的视频内容,为多领域带来大模型技术飞跃的冲击。如何推进大模型应用,已成为各行业面临的重要课题之一。 打造硬核架构  输送海量算力

    2024年04月08日
    浏览(43)
  • 为什么理想滤波器不可实现

    系统对于信号的作用大体可分为两类:一类是信号的传输,一类是滤波。信号传输要求信号尽量不失真,而滤波则要求滤去或削弱不需要的成分,必然伴随着失真。接下来,本文将从信号的无失真传输来引入信号的滤波,进而详细阐明为什么理想滤波器不可实现。 想必大家都

    2024年02月11日
    浏览(42)
  • Gitpod:让编码更高效的理想工具

    你好,我是坚持分享干货的 EarlGrey,翻译出版过《Python编程无师自通》、《Python并行计算手册》等技术书籍。 如果我的分享对你有帮助,请关注我,一起向上进击。 创作不易,希望大家给一点鼓励,把公众号设置为“星标”,给文章点个“赞”和“在看”,谢谢大家啦~ 我自

    2024年02月04日
    浏览(31)
  • Copilot是GPT的理想应用模式吗?

    自OpenAI发布ChatGPT以来,LLM持续火热,各大公司纷纷入场。但近一段时间以来,我观测到的LLM应用场景,基本都是Copilot的形式,即以对话为基础的辅助应用。尽管体验起来十分的高大上,但我能明确感受到,这种Copilot的形式并不解决当前的诉求。因此,本篇尝试探讨一下,

    2024年02月13日
    浏览(53)
  • 理想架构的Doherty功率放大器理论与仿真

    参考: 三路Doherty设计 01 射频基础知识–基础概念 ADS仿真工程文件链接:理想架构的Doherty功率放大器理论与仿真 Doherty功放是一种利用负载调制技术提高回退效率的功放,其应用背景是为了解决通信系统中调制信号峰均比越来越大,而传统放大器在功率回退点效率低的问题。

    2024年01月23日
    浏览(42)
  • 企业组网的理想选择 侠诺智能路由器简介

    一、侠诺智能路由针对企业的其它特殊应用或重要应用,可通过VIP功能,设定其IP地址或直接把该应用设定为VIP对象,优先让出使用带宽保证数据传送的流畅,在不禁止或限制其它应用的前提下,实现无线网络应用加速,对企业来说的ERP、邮件、视频电话等,用户的重要程度

    2024年02月05日
    浏览(62)
  • 汽车过户时,怎么选到理想的好车牌?

    在汽车过户的过程中,选到一副理想的好车牌就像买彩票中大奖一样令人兴奋。但是,怎样找到这样一块车牌呢?这就是本文要探讨的问题。 首先,我们来聊聊选车牌的技巧。很多人喜欢选择有特别数字的车牌,如“8888”、“6666”等,认为这些数字代表了好运。但这只是迷

    2024年02月14日
    浏览(42)
  • 02【评价类】模型——TOPSIS法(理想解法、优劣解距离法)

    目录 02【评价类】模型——TOPSIS法(理想解法、优劣解距离法)  一、引述 二、TOPSIS法的应用 2.1 决策矩阵正向化处理 2.1.1 效益型指标(极大型指标) 2.1.2 成本型指标(极小型指标) 2.1.3 区间型指标 2.1.4 中间型指标 2.1.5 问题解决  2.2 正向化矩阵规范化处理 2.3 构造指标的权

    2024年01月23日
    浏览(51)
  • 探索色彩搭配的奥秘:如何选择适合产品的理想配色方案

    友善的色彩搭配和色调选择是现代产品设计中不可忽视的关键因素。通过正确选择配色方案和色调,产品可以吸引用户的注意力、传达品牌信息并提供愉悦的用户体验。 2.1 吸引力和品牌形象 色彩搭配和色调直接影响产品的吸引力和品牌形象。例如,鲜艳明亮的配色方案可以

    2024年03月09日
    浏览(74)
  • 中小团队的理想选择:适合多人协作的办公软件推荐

    随着互联网和数字化技术的不断发展,越来越多的企业开始采用多人协作办公软件来提高工作效率和团队合作能力。在这篇文章中,我们将探讨哪些多人协作办公软件适合中小团队使用。 “哪些多人协作办公软件适合中小团队?简单易用的有Zoho Projects、Asana、Slack、Google Do

    2024年02月12日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包