标签: r machine-learning data-cleaning
我有一个数据集,它有近190列和20000行。现在一些列(接近70列)有大约19500行与NA。我正在考虑两种方法: 1)删除包含大量NA值的列 2)删除NA值为
方法2将为我留下500行和120列的数据集,大大减少了我的训练数据集。方法1可能会删除一些重要的功能。
我应该如何解决这个问题。