仅在某些列中清理包含大量NA的数据集

时间:2015-10-19 17:42:18

标签: r machine-learning data-cleaning

我有一个数据集,它有近190列和20000行。现在一些列(接近70列)有大约19500行与NA。我正在考虑两种方法: 1)删除包含大量NA值的列 2)删除NA值为

的行

方法2将为我留下500行和120列的数据集,大大减少了我的训练数据集。方法1可能会删除一些重要的功能。

我应该如何解决这个问题。

0 个答案:

没有答案