使用missForest进行部分插补

时间:2016-10-13 00:13:59

标签: r

我尝试使用R中的missForest包来部分归因于数据集。详细地说,我想估算所有度量变量,但只留下几列。这可能吗?

2 个答案:

答案 0 :(得分:0)

如果我能正确理解你的问题,我有一个潜在的解决方案。我将为您提供一些应该完全可重现的代码。

## Get some data...
data(iris)

## The data contains four continuous and one categorical variable.
## Artificially produce missing values using the 'prodNA' function:
set.seed(81)
iris.mis <- prodNA(iris, noNA = 0.1)

## Impute missing values for just the first four columns of data
iris.mis[,1:4] <- missForest(iris.mis)$ximp[,1:4]

如果这样的方法有效,请告诉我。如果它不起作用,请查看是否可以使用一些示例代码来说明原因。

答案 1 :(得分:0)

根据我的理解,您需要留下几列并使用missForest函数来估算其他列。简单的解决方案是

imputedData <- missForest(dataset[c( 2, 3)])
dataset <- data.frame(dataset[1], imputedData)

传递列需要进行估算(此处为2,3),然后将其合并。