我收到了一些问题,除非我遗漏某些内容或者不了解插补过程/逻辑,否则我无法在文档中找到任何内容。
基本上最重要的是,因为有时会推算'值是不同的,我想取平均值 - 如果是数字 - 或模式,如果它是一个分类值。
我看到的所有示例显示"完成(miced_model,1)"。如果我用5或10次不同的迭代运行鼠标模型,我就不会看到只选择1的点。我喜欢它们的平均值。
有人能告诉我怎么做吗?
set.seed(2016)
library(mice)
nhanes # this is the dataset
nhanes[5,1]=NA # setting up some categorical examples
nhanes[1,1]=NA
nhanes$age = as.factor(nhanes$age)
imputed_values = mice(nhanes, m = 5, method='rf',maxit = 3)
new_nhanes = complete(imputed_values, 'long') # or repeated? or what?
new_hanes_fixed = # new data frame with averaged values imputed rather than just arbitrary '1st' iteration?
谢谢!
答案 0 :(得分:0)
你应该看一下SimonG的评论
你完全走错了路。 多重插补的重点在于您有不同的插补数据集。 (你将在其上进行分析)
如果您不需要多次插补,您可以直接使用单一插补方法。(例如来自VIM包的kNN或imri功能)
答案 1 :(得分:0)
听起来您想要汇总分析结果,这样就可以对每个估算数据集进行分析。在这里阅读有关池数据的更多信息: https://www.r-bloggers.com/imputing-missing-data-with-r-mice-package/