Question

我收到了一些问题，除非我遗漏某些内容或者不了解插补过程/逻辑，否则我无法在文档中找到任何内容。

基本上最重要的是，因为有时会推算＆＃39;值是不同的，我想取平均值 - 如果是数字 - 或模式，如果它是一个分类值。

我看到的所有示例显示＆＃34;完成（miced_model，1）＆＃34;。如果我用5或10次不同的迭代运行鼠标模型，我就不会看到只选择1的点。我喜欢它们的平均值。

有人能告诉我怎么做吗？

set.seed(2016)
library(mice)
nhanes # this is the dataset
nhanes[5,1]=NA  # setting up some categorical examples
nhanes[1,1]=NA
nhanes$age = as.factor(nhanes$age)
imputed_values = mice(nhanes, m = 5, method='rf',maxit = 3)
new_nhanes = complete(imputed_values, 'long') # or repeated? or what?

new_hanes_fixed =   # new data frame with averaged values imputed rather than just arbitrary '1st' iteration?

谢谢！

Answer 1

你应该看一下SimonG的评论

你完全走错了路。多重插补的重点在于您有不同的插补数据集。（你将在其上进行分析）

如果您不需要多次插补，您可以直接使用单一插补方法。（例如来自VIM包的kNN或imri功能）

Answer 2

听起来您想要汇总分析结果，这样就可以对每个估算数据集进行分析。在这里阅读有关池数据的更多信息： https://www.r-bloggers.com/imputing-missing-data-with-r-mice-package/

平均估算缺失值

2 个答案: