在变量中替换NAs?

时间:2018-10-21 10:16:39

标签: r imputation r-mice

晚上好,

我有一个数据集,其中存在一个变量,即性别缺失数据。谁能帮助我,我该如何使用R Packages替换这些NA。我已经尝试过“小鼠”软件包,但是它不能代替NA,并且仍然存在于“性别”列下的数据中。我在下面的代码中提供了示例数据。预先感谢您的支持。

https://ss64.com/nt/set.html

使用的R-代码: Dataset sample

关于, 库马尔

1 个答案:

答案 0 :(得分:0)

这是太多的代码。您可以尝试使用method =“ rf”或method =“ cart”来估算丢失的数据,尽管以我的经验,cart方法似乎更准确。  您还可以使用preprocess函数,也可以使用meanImpute或knnImpute,因为它为这种估算提供了很好的结果。 老鼠的例子:

test_imp<-mice(df,m=5,method="cart",printFlag=F)
 test_imputed<-complete(test_imp,3)#Selects third imputation

具有预处理的示例

test_1<-preprocess(testdf,"medianImpute")
test_imputed<-predict(test_imputed,test_1)