如果在数据集中我们在分类变量和连续变量中都缺少值,那么如何通过替换分类变量的模式和连续变量的均值来处理它们?
答案 0 :(得分:0)
当丢失的数据随机丢失时,您可以使用多次插补来估算缺失的值。
有关多重插补的更多信息,我建议使用C.K.的应用缺失数据一书。恩德斯(2010年)。它也有一个很棒的companion website。
对于R
中的多重插补,您可以使用mice
包。以下是CRAN
上的link,文档的link以及统计软件期刊中文章的link >
还有其他包用于多重插补。
答案 1 :(得分:0)
您可以尝试使用fillna()或interpolate()
有关这两个的更多详细信息,请参考我在StackOverflow中对这个问题的回答。链接是:Missing values in Time Series in python