R中的多重插补(小鼠)和“条件缺失”

时间:2017-03-24 16:12:13

标签: r imputation r-mice

我在R中使用NAs来估算随机丢失的数据。尝试在数据集中考虑条件或结构TestData <- data.frame(Condition= c(1,1,1,1,2,NA,2,2), Dependent1=c(1,NA,2,3,NA,NA,NA,NA), Dependent2=c(1,12,44,1,NA,NA,NA,NA), Dependent3=c(NA,2,3,5,NA,NA,NA,NA), UnaffiliatedQ=c(1,NA,3,2,27,NA,32,35)) TestData$Condition <- factor(TestData$Condition, levels = c(1,2), labels = c("Yes","No")) 时,我遇到了问题。

用于说明问题的简单数据集:

Condition

在此示例中,变量Dependent#是一个看门人问题,用于确定受访者是否需要填写接下来的三个问题NA。如果受访者回答“否”并且他/她没有看到接下来的三个问题,那么他们被标记为NA - 虽然技术上没有丢失。

在这种情况下我该怎么办?如果我将Condition变量中的Dependent1值与Dependent2Dependent3Dependent#中的值一起归入-999值,我将如何确保最终得到mice中没有意义的值?

我已经考虑过可能的解决方案,但我认为没有一个是有效的或者是个好主意,例如,创建一个结构化的缺失值,例如mice基于条件答案对数据帧进行子集化。

在阅读{{1}}作者的文档和论文时,我在{{1}}中没有看到任何关于此类情况的论点。另一种选择是,我只是在多次插入的兔子洞中运行,这不是正确使用它。

0 个答案:

没有答案