选择包含许多观察值的列

时间:2016-03-21 00:55:15

标签: r

我有一个包含大量观察和大量变量的数据集。但是一些变量只有一些观察结果的真实值。如何删除少于500个观察值的变量?

我一直试图在dplyr的上下文中找到一种方法,但select()似乎没有这样做。

这也没有意义,但这是我一直在想的方向:

dat[,sum(!is.na) > 500]

1 个答案:

答案 0 :(得分:0)

我们可以使用vapply

dat[vapply(dat, function(x) sum(is.na(x)) <=500, 0)]

Filter

Filter(function(x) sum(is.na(x)) <= 500, dat)