我正在使用估算来处理缺失的数据。我正在探索Amelia和rms包的插补。我对这些包有一些疑问。
我想结合Amelia的推算数据集。我确实看到Amelia有一个函数mi.meld
,它结合了多重插补的结果。但我想首先组合数据集然后训练不同的模型。我不确定是否梳理数据集然后使用该数据以正确的方式训练模型。我想这样做是因为我的测试数据也缺少数据。我想用插补处理它,以便我可以用它来预测值。
for(i in 1:impute$m) {
model <- rpart(Y ~X1+X2+X3+X4+X5,
data=impute$imputations[[i]],method="anova",control=rpart.control(cp=0.001))
b.out <- rbind(b.out, model$coef)
se.out <- rbind(se.out, coef(summary(model))[,2])
}
combined.results <- mi.meld(q = b.out, se = se.out)
我也在使用rms包。我想确认aregImpute
函数是否结合了插补数据集?
impute<- aregImpute(Y~X1+X2+X3+X4+X5,data= train_data,n.impute=5,nk=0)
有没有人建议如何将多个插补数据集合并到一个数据集中?