如何计算每列中的NA并删除具有超过100 NA的列

时间:2016-10-27 11:40:12

标签: r na

数据集属性标题

enter image description here

我是初学者,我正在尝试这样的事情:

for (i in newTrain) {
 count = 0
 count = length(which(is.na(newTrain$i)))
 names(-which(count>100))
}  

但这对我来说根本不起作用。

1 个答案:

答案 0 :(得分:3)

我们可以先为整个数据框应用is.na,然后为每列sum NA的值。然后选择NA值小于100的列。

newTrain[colSums(is.na(newTrain)) < 100]