数据集属性标题
我是初学者,我正在尝试这样的事情:
for (i in newTrain) {
count = 0
count = length(which(is.na(newTrain$i)))
names(-which(count>100))
}
但这对我来说根本不起作用。
答案 0 :(得分:3)
我们可以先为整个数据框应用is.na
,然后为每列sum
NA
的值。然后选择NA
值小于100的列。
newTrain[colSums(is.na(newTrain)) < 100]