平均估算缺失值

时间:2016-12-19 07:16:42

标签: r missing-data imputation r-mice

我收到了一些问题,除非我遗漏某些内容或者不了解插补过程/逻辑,否则我无法在文档中找到任何内容。

基本上最重要的是,因为有时会推算'值是不同的,我想取平均值 - 如果是数字 - 或模式,如果它是一个分类值。

我看到的所有示例显示"完成(miced_model,1)"。如果我用5或10次不同的迭代运行鼠标模型,我就不会看到只选择1的点。我喜欢它们的平均值。

有人能告诉我怎么做吗?

set.seed(2016)
library(mice)
nhanes # this is the dataset
nhanes[5,1]=NA  # setting up some categorical examples
nhanes[1,1]=NA
nhanes$age = as.factor(nhanes$age)
imputed_values = mice(nhanes, m = 5, method='rf',maxit = 3)
new_nhanes = complete(imputed_values, 'long') # or repeated? or what?

new_hanes_fixed =   # new data frame with averaged values imputed rather than just arbitrary '1st' iteration?

谢谢!

2 个答案:

答案 0 :(得分:0)

你应该看一下SimonG的评论

你完全走错了路。 多重插补的重点在于您有不同的插补数据集。 (你将在其上进行分析)

如果您不需要多次插补,您可以直接使用单一插补方法。(例如来自VIM包的kNN或imri功能)

答案 1 :(得分:0)

听起来您想要汇总分析结果,这样就可以对每个估算数据集进行分析。在这里阅读有关池数据的更多信息: https://www.r-bloggers.com/imputing-missing-data-with-r-mice-package/