在Python中处理分类数据中缺失值的更简单方法

时间:2019-09-15 04:04:00

标签: r python-3.x missing-data imputation

我试图以类似的方式在Python中估算缺失值,因为我可以在R中使用“鼠标”包。这是因为我在R中使用的估算方式不需要数据为数字,它也可以是分类的。

例如,我在R中设置了一个玩具数据:

A <- c('M','F',NA,'M',NA,'F')
B <- c('Y','N','N','N',NA,'N')
C <- c(10, 4,8,7,11,8)
D <- c(0,1,0,1,1,0)
df <- data.frame(A,B,C,D)

我可以像这样轻松估算这些NA条目:

tempData <- mice(df,m=5,maxit=50,meth='cart',seed=500)
complete(tempData)

此方法使用CART,即决策树插补方法。 据我所知,fancyimpute或sklearn插补软件包都可以做到这一点,对吗?我找不到任何东西。

0 个答案:

没有答案