果推断16--基于反事实因果推断的度小满额度模型学习笔记

这篇具有很好参考价值的文章主要介绍了果推断16--基于反事实因果推断的度小满额度模型学习笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、原文地址

二、一些问题

2.1如何从RCT随机样本过渡到观测样本因果建模?

2.2反事实学习的核心思想

2.3度小满的连续反事实额度模型 Mono-CFR

2.4Mono-CFR代码实现(待补充)

2.5CFR学习

2.5.1TarNet

2.5.2CFR

2.5.3DR-CFR

参考


 文章来源地址https://www.toymoban.com/news/detail-471097.html

一、原文地址

基于反事实因果推断的度小满额度模型

二、一些问题

2.1如何从RCT随机样本过渡到观测样本因果建模?

对于RCT样本的情况,如果希望评估ATE指标,可以通过分组相减或DID(difference in difference)。如果希望评估CATE指标,可以通过uplift 建模。常见的方法比如有meta-learner,double machine learning,causal forest等等。这里需要注意必要的三大假设:SUTVA,Unconfoundedness和Positivity。最核心的假设为:不存在未观测混淆因子。

对于仅有观测样本的情况,无法直接获取treatment->outcome的因果关系,我们需要借助必要的手段切断covariates到treatment的后门路径。常见方法是工具变量法和反事实表示学习。工具变量法需要对具体业务抽丝剥茧,绘制业务变量中因果图。反事实表示学习则依靠成熟的机器学习,匹配covariates相似的样本做因果评估。

果推断16--基于反事实因果推断的度小满额度模型学习笔记

X:特征

W:工具变量

D:干预

Y:gmv

首先通过X预测T,与真实的T作差,得到一个T的残差,然后通过X预测Y,与真实的Y作差,得到一个Y的残差,预测模型可以是任何ML模型,最后基于T的残差和Y的残差进行因果建模。

2.2反事实学习的核心思想

 

反事实学习的核心思想就是平衡不同treatment下的特征分布。

核心问题有两个:

1. 如何调整训练样本的权重? 

2. 如何在表示空间中,使变换后的样本在实验组和对照组分布更加均衡?

本质思想是在变换映射后,为每个样本寻找它的反事实“双胞胎”。映射之后treatment组和control组X的分布比较相似。

果推断16--基于反事实因果推断的度小满额度模型学习笔记

2.3度小满的连续反事实额度模型 Mono-CFR

 

最后来介绍一下度小满的反事实额度模型,这里主要解决的是在观测数据上对连续型Treatment的反事实估计问题。

模型思想:给定期望额度μ(T|X),学习∆T与Y的单调性关系(Dose-Response Curve)。期望额度可以理解为模型学习到的连续性倾向额度,使得混淆变量C和额度T之间的关系能够断开,转换成∆T与Y的因果关系学习,从而对∆T下Y的分布进行较好的刻画。

果推断16--基于反事实因果推断的度小满额度模型学习笔记

2.4Mono-CFR代码实现(待补充)

2.5CFR学习

2.5.1TarNet

Pytorch版本

GitHub - patrickzoechbauer/TarNet

Tensorflow版本

GitHub - arnaud39/TARNet: TARNet Model with tensorflow 2 API.

治疗不可知论表征网络,是一种机器学习架构,其具有为特定子网络馈电的通用MLP。它可以帮助识别数据中的偏差,估计平均治疗效果或充当类似迁移学习的模型。

TARNet模型架构

此包将此模型实现为类似于keras的TensorFlow API模型。//

2.5.2CFR

Estimating individual treatment effect: generalization bounds and algorithms

https://openreview.net/pdf?id=HkxBJT4YvB

GitHub - clinicalml/cfrnet: Counterfactual Regression

摘要:将机器学习应用于医疗保健、经济学和教育等领域因果推理问题引起了人们的极大兴趣。特别是,个人层面的因果推理具有重要的应用,例如精准医学。我们给出了一种新的理论分析和算法家族,用于从观测数据中预测个体治疗效果(ITE),假设被称为强可忽略性。该算法学习“平衡”表示,使诱导处理分布和控制分布看起来相似,我们给出了一个新的直观的泛化误差界,表明表示的预期ITE估计误差受该表示的标准泛化误差和表示引起的处理分布和控制分布之间的距离之和的限制。我们使用积分概率度量来测量分布之间的距离,推导出 Wasserstein 和最大平均差异 (MMD) 距离的显式边界。对真实数据和模拟数据的实验表明,新算法匹配或优于最先进的算法。

在TarNet加入IPM后就是我们所说的CounterFactual Regression Network (CFRNet)。

果推断16--基于反事实因果推断的度小满额度模型学习笔记

果推断16--基于反事实因果推断的度小满额度模型学习笔记

2.5.3DR-CFR

Learning Disentangled Representations for CounterFactual Regression

学习反事实回归的解纠缠表征
摘要:我们考虑从观察数据中估计治疗效果的挑战;指出,一般来说,只有一些基于观察到的协变量 X 的因素有助于选择治疗 T ,只有一些因素来确定结果 Y。我们通过考虑 {X, T, Y } 的三个潜在来源来模拟这一点,并表明显式建模这些来源为指导设计更好地处理观察数据集中的选择偏差的模型提供了很好的见解。本文试图概念化这一思路,并提供进一步探索它的路径。在这项工作中,我们提出了一种算法(1)从任何给定的观察数据集 D 和(2)中识别上述潜在因素的分离表示,并利用这些知识来减少选择偏差对从 D 估计治疗效果的负面影响。我们的实证结果表明,所提出的方法在基于个人和人口的评估措施中都实现了最先进的性能。

参考

  1. 因果推断 之 DeR-CFR - 知乎
  2. DML-因果推断 - 知乎
  3. 因果推断5--DML(个人笔记)_dml因果_飞翔的七彩蜗牛的博客-CSDN博客
  4. 基于反事实因果推断的度小满额度模型
  5. 因果推断深度学习工具箱 - CounterFactual Regression with Importance Sampling Weights - 简书
  6. 因果推断综述及基础方法介绍(二)
  7. 因果推断|反事实推断|经典论文解读|SITE模型-基于表示学习 - 知乎
  8. 因果推断|反事实推断|经典论文解读|TargetNet&CFR模型-基于表示学习 - 知乎
  9. 因果推断 之 DeR-CFR - 知乎
  10. 因果推断笔记 | 因果推断中的表示学习 TarNet & CFRNet - 知乎
  11. 大白话谈因果系列文章(四)估计uplift--深度学习方法 - 知乎
  12. [转]增益模型(Uplift Modeling)的原理与实践_Just Jump的博客-CSDN博客
  13. uplift model增益模型相关术语概念名词汇总_Just Jump的博客-CSDN博客

 

 

 

 

到了这里,关于果推断16--基于反事实因果推断的度小满额度模型学习笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 因果推断(五)基于谷歌框架Causal Impact的因果推断

    除了传统的因果推断外,还有一些机器学习框架可以使用,本文介绍来自谷歌框架的Causal Impact。该方法基于合成控制法的原理,利用多个对照组数据来构建贝叶斯结构时间序列模型,并调整对照组和实验组之间的大小差异后构建综合时间序列基线,最终预测反事实结果。 C

    2024年02月11日
    浏览(28)
  • [因果推断] 增益模型(Uplift Model)介绍(三)

    增益模型(uplift model):估算干预增量(uplift),即 干预动作(treatment) 对 用户响应行为(outcome) 产生的效果。 这是一个 因果推断(Causal Inference) 课题下估算 ITE (Individual Treatment Effect)的问题——估算同一个体在 干预与不干预 (互斥情况下)不同outcome的差异。为了克

    2024年02月06日
    浏览(25)
  • 因果推断《Causal Inference in Python》中文笔记第1章 因果推断导论

    《Causal Inference in Python: Applying Causal Inference in the Tech Industry》因果推断啃书系列   第1章 因果推断导论   第2章 随机实验与统计学回顾   第3章 图形化因果模型   第4章 线性回归的不合理有效性   第5章 倾向分   第6章 效果异质性   第7章 元学习器   第8章

    2024年02月21日
    浏览(28)
  • 因果推断(四)断点回归(RD)

    在传统的因果推断方法中,有一种方法可以控制观察到的混杂因素和未观察到的混杂因素,这就是断点回归,因为它只需要观察干预两侧的数据,是否存在明显的断点。 ⚠️注意:当然这个方法只能做到局部随机,因此很难依据该结论推向全局。 本文参考自rdd官方示例,通

    2024年02月13日
    浏览(32)
  • 因果推断4--Causal ML(个人笔记)

    目录 1 安装教程及官方文档 1.1 pip安装 1.2 API文档 1.3 代码仓库 2 Uplift模型与主要方法介绍 2.1 发放代金券 2.2 多treatment 2.3 实验方法 3 causalml.inference.tree module 3.1 UpliftTreeClassifier 3.2 UpliftRandomForestClassifier 3.3 CausalRandomForestRegressor 4 待补充 5 问题 pip install causalml https://causalml.r

    2024年02月12日
    浏览(26)
  • 因果推断-PSM的原理及python实现

    目录 一、背景:员工技能培训真的是浪费时间吗 二、PSM的原理及python实现 1、PSM的原理 1.1 计算倾向性得分 1.2 匹配对照组样本 1.3 平衡性检查 1.4 敏感度分析 2、PSM的python实现 假设你是一家大企业的老板,你希望知道员工技能培训对员工生产率的提升有多大帮助。已知参加培

    2024年02月15日
    浏览(29)
  • 因果推断之微软开源的dowhy使用学习

    本文参考微软dowhy官网文档,并参考相关博客进行整理而来,官方地址:https://github.com/py-why/dowhy 因果推理 是基于观察数据进行反事实估计,分析干预与结果之间的因果关系。 DoWhy是微软发布的 端到端 因果推断Python库,主要特点是: 基于一定经验假设的基础上,将问题转化

    2024年02月09日
    浏览(26)
  • 收集一些因果推断比较好的工具包,教程

    1.国内一个武汉大学教授手下博士写的基础的因果知识课件: http://www.liuyanecon.com/wp-content/uploads/%E7%8E%8B%E5%81%A520201022.pdf 感兴趣可以看看其他手下博士做的课件: Causal inference reading group 2020 – 刘岩 – 宏观金融 2.耶鲁大学教授课程全套  课件+代码+视频 代码:GitHub - paulgp/app

    2023年04月10日
    浏览(26)
  • 大咖观点| AIGC与因果推断的双向赋能

    近日,由DataFun主办的第三届数据科学在线峰会盛大举办。聚焦机器学习与数据挖掘、AB实验、因果推断、数据中台与数字化转型、用户增长与运营、数据科学最佳实践等6大数据科学主题,数十位国内外一线数据科学家围绕数据科学前沿技术成果和应用实践经验深入分享和交流

    2024年02月15日
    浏览(26)
  • 逆向推理与因果推断:人工智能在社交网络的应用

    社交网络已经成为我们现代生活中不可或缺的一部分,它们为我们提供了一种高效、实时的沟通和交流方式。然而,社交网络也面临着许多挑战,如信息过载、虚假信息、隐私泄露等。人工智能技术在这些方面发挥着重要作用,尤其是逆向推理和因果推断等算法。 在本文中,

    2024年02月21日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包