缺少价值归责

时间:2018-03-06 09:06:29

标签: missing-data imputation

如果在数据集中我们在分类变量和连续变量中都缺少值,那么如何通过替换分类变量的模式和连续变量的均值来处理它们?

2 个答案:

答案 0 :(得分:0)

当丢失的数据随机丢失时,您可以使用多次插补来估算缺失的值。

有关多重插补的更多信息,我建议使用C.K.的应用缺失数据一书。恩德斯(2010年)。它也有一个很棒的companion website

对于R中的多重插补,您可以使用mice包。以下是CRAN上的link,文档的link以及统计软件期刊中文章的link >

还有其他包用于多重插补。

答案 1 :(得分:0)

您可以尝试使用fillna()或interpolate()

有关这两个的更多详细信息,请参考我在StackOverflow中对这个问题的回答。链接是:Missing values in Time Series in python