检查列中是否缺少值的最佳方法是什么?而且,如果只有有限数量的值缺失,我应该删除它们还是估算值?
答案 0 :(得分:0)
在假设您要在一个数据框中维护数据的情况下,我建议您采取以下措施:对于要进一步研究的列,只需使用sum(is.na(…))
函数组合。关于您的插补问题(假设此问题是在回归的背景下提出的),我想说这在很大程度上取决于数据集的具体情况:插补技术有多种形式,并且对数据集的质量有不同的影响(本文详细介绍了以下技术:https://arxiv.org/pdf/1801.04058.pdf)。