我有一个包含大量观察和大量变量的数据集。但是一些变量只有一些观察结果的真实值。如何删除少于500个观察值的变量?
我一直试图在dplyr
的上下文中找到一种方法,但select()
似乎没有这样做。
这也没有意义,但这是我一直在想的方向:
dat[,sum(!is.na) > 500]
答案 0 :(得分:0)
我们可以使用vapply
dat[vapply(dat, function(x) sum(is.na(x)) <=500, 0)]
或Filter
Filter(function(x) sum(is.na(x)) <= 500, dat)