重新编码鼠标mids对象

时间:2016-01-17 18:09:32

标签: r r-mice

我有一个mids来自mice的对象。我想重新编码一些估算变量并保留mids对象。我知道我可以将mids对象转换为" long"使用complete(),但我希望保留mids对象,因为它有一些额外的用途。

以下是使用nhanes数据集的示例。运行mice()会为nhanes中的变量创建5个插补数据集。我专注于hyp

library(mice)
names(nhanes)
nhanes$hyp
#[1] NA  1  1 NA  1 NA  1  1  1 NA NA NA  1  2  1 NA  2  2 1  2 NA  1  1  1  
imp <- mice(nhanes, print = FALSE)
imp$imp$hyp
# 1 2 3 4 5
# 1  1 1 1 1 1
# 4  2 1 1 2 2
# 6  1 1 1 1 1
# 10 1 1 1 1 1
# 11 1 1 2 1 1
# 12 1 1 1 1 2
# 16 1 1 2 1 1
# 21 1 1 2 1 1

我如何重新编码hyp对象mids中的估算imp值(例如,1&#39}成为5&#39}。

到目前为止,我唯一的想法是将imp转换为long,将感兴趣的变量提取到新的数据框中,重新编码,通过as.mids转换新数据框,然后重新投入imp通过cbind.mids()

imp_long <- complete(imp, "long", include=T)
hyp <- imp_long[, "hyp"]
hyp2 <- hyp
hyp2[hyp2==1] <- 5
hyp4mids <- data.frame(.imp = rep(0:5, each = nrow(nhanes)),
                       .id = rep(1:nrow(nhanes), times = 6),
                       hyp2,
                       TMP = NA)
hyp4mids <- as.mids(hyp4mids, .imp = 1, .id = 2)
hyp4mids$chainMean <- hyp4mids$chainVar <- array(NA, dim = c(2, 25, 5),
                                                 dimnames = list(
                                                   c("hyp2", "TMP"),
                                                   1:25,
                                                   paste0("Chain ", 1:5)))
imp2 <- cbind.mids(imp, hyp4mids)
imp2$imp$hyp2
# 1 2 3 4 5
# 1  5 5 5 5 5
# 4  2 5 5 2 2
# 6  5 5 5 5 5
# 10 5 5 5 5 5
# 11 5 5 2 5 5
# 12 5 5 5 5 2
# 16 5 5 2 5 5
# 21 5 5 2 5 5

虽然有效,但我认为我应该可以直接在hyp mids对象中修改imp

1 个答案:

答案 0 :(得分:2)

似乎诀窍是修改$ data和$ imp:

imp <- mice(nhanes, print = FALSE)
l1 <- complete(imp, "long") 
table(l1$hyp)
# 1  2 
#92 33 

imp$data$hyp[imp$data$hyp==1] <- 5
imp$imp$hyp[imp$imp$hyp==1] <- 5
l2 <- complete(imp, "long")
table(l2$hyp)
# 2  5 
#33 92