哪个MICE估算数据集用于后续分析?

时间:2017-02-24 17:58:46

标签: r-mice

我不确定是否需要为此提供可重现的输出,因为这是一个更普遍的问题。无论如何,在运行鼠标包之后,它返回m多个插补数据集。我们可以使用complete()函数提取数据。

但是我很困惑,我将使用哪个数据集进行后续分析(描述性估算,模型构建等)。

问题: 1.我是否需要提取特定数据集,例如complete(imp,1)?或者我应该使用整个插补数据集,例如complete(imp, "long", inc = TRUE)

  1. 如果是后者complete(imp, "long", inc = TRUE),我该如何计算一些描述性内容,如均值,比例等?例如,我将使用SPSS分析长数据。我应该根据m插补数据集的数量拆分数据并手动查找平均值?是应该怎么做?
  2. 感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

您应该分别对每个m推算数据集运行统计分析,然后将结果汇总在一起。这使您可以考虑插补程序引入的额外不确定性。 MICE内置了这个功能。例如,如果你想做一个简单的线性模型,你会这样做:

fit <- with(imp, lm(y ~ x1 + x2))
est <- pool(fit)
summary(est)

结帐?pool?mira

答案 1 :(得分:0)

多重插补包括以下三个步骤:

1. Imputation
2. Analysis
3. Pooling

在第一步中,生成m个插补数据集,在第二步数据分析中,例如回归分别应用于每个数据集。最后,在第三步中,将分析结果汇总到最终结果中。存在针对不同参数实现的各种池化技术。 这是一个很好的链接,详细描述了汇集 - mice Vignettes