我已经使用MatchIt包(ratio = 5)在R中完成了1:5的倾向得分匹配,但是我怎么知道“ 5”中哪一个与“ 1”最匹配,哪一个最差?从导出的结果中,我看到一个名为“ distance” 的变量,它是什么意思?我可以用它来衡量各种方法的适用性吗?
答案 0 :(得分:0)
distance
是倾向得分(或用于创建两个单位之间距离的任何值)。请参阅我的答案here以获取解释。如果使用Mahalanobis距离匹配,它将为空。
要查找与谁匹配的人,请查看输出对象的$match.matrix
组件。每一行代表一个已处理的单位,其行名或索引被指定为此矩阵的行名。对于给定的行,该行中的值表示与已处理单元匹配的控制单元。如果一个条目是NA
,则表示没有匹配项。通常,您会看到类似四个非NA
值和一个NA
值的情况;这意味着该处理单元仅与四个控制单元相匹配。
如果使用最近邻匹配,则列在距离方面将按与所处理单位的接近程度排序。因此,第一列中的索引比第二列中的索引更接近已处理的单位,依此类推。如果使用了另一种匹配方式,则不是这种情况。
匹配的“适合性”有两个方面:协变量平衡和剩余(有效)样本量。要评估两者,请使用cobalt
程序包,然后在输出对象上运行bal.tab()
。您希望均值差的值较小,而(有效)样本量的值较大。如果您担心个人在匹配的阶层中有多近,可以手动计算匹配的阶层中的个体之间的距离。只是知道接近倾向分数并不意味着两个单位实际上彼此相似。