我尝试使用R中的missForest
包来部分归因于数据集。详细地说,我想估算所有度量变量,但只留下几列。这可能吗?
答案 0 :(得分:0)
如果我能正确理解你的问题,我有一个潜在的解决方案。我将为您提供一些应该完全可重现的代码。
## Get some data...
data(iris)
## The data contains four continuous and one categorical variable.
## Artificially produce missing values using the 'prodNA' function:
set.seed(81)
iris.mis <- prodNA(iris, noNA = 0.1)
## Impute missing values for just the first four columns of data
iris.mis[,1:4] <- missForest(iris.mis)$ximp[,1:4]
如果这样的方法有效,请告诉我。如果它不起作用,请查看是否可以使用一些示例代码来说明原因。
答案 1 :(得分:0)
根据我的理解,您需要留下几列并使用missForest
函数来估算其他列。简单的解决方案是
imputedData <- missForest(dataset[c( 2, 3)])
dataset <- data.frame(dataset[1], imputedData)
传递列需要进行估算(此处为2,3),然后将其合并。