因果推断-IPTW与最近邻居匹配

时间:2019-05-12 13:47:49

标签: causality

我正在做一个准实验,并且对获得ATT感兴趣。我有一个数据,其中Ti = 0时有260k条目,Ti = 1时有5k条目。我正在使用iptw技术计算ATT,在其中我实现了很大的平衡,并且治疗效果为-ve 450欧元,但并不显着。

重量计算: (如果治疗= 1,则体重= 1,否则倾向得分/(1倾向得分)

然后,与其他方法进行比较,我使用比率= 1的最近邻居匹配,再次达到了平衡。我得到的治疗效果(匹配时默认为ATT)为+750,非常显着。

两种方法都不会产生相似的结果吗?在这种情况下,我应该选择哪种方法?为什么?

2 个答案:

答案 0 :(得分:0)

当您配对时,是否有任何未配对的受治疗个体?

预期,IPTW和匹配项应给出相同的答案。一种可能的解释是,某些接受治疗的人没有相配的人,所以他们被放弃了。发生这种情况时,为其定义因果效应的总体将发生变化。这可能导致方法之间的答案不同

答案 1 :(得分:0)

每种方法都需要进行不同的评估。

对于IPW,您需要检查是否没有获得极低(或极高)倾向的样本。如果它们接近0或1,则需要评估发生这种情况的原因,并可能从数据中删除类似的样本。由于您的标签非常不平衡,因此肯定会发生。

要进行匹配,例如@pzivich所说,您需要检查是否存在未匹配的样本(类似于非常低的倾向)

最后,我喜欢检查保留数据的平衡,以确保没有过度拟合。