基于分组计数的过滤器

时间:2020-08-17 20:27:13

标签: r dplyr

> diamonds %>% group_by(color) %>% tally %>% arrange(desc(n))
# A tibble: 7 x 2
  color     n
  <ord> <int>
1 G     11292
2 E      9797
3 F      9542
4 H      8304
5 D      6775
6 I      5422
7 J      2808

我想过滤钻石以排除总计数小于6K的所有组。

我当时想我可以按nest()然后按unnest()进行分组,但想知道是否有使用窗口函数进行过滤的代码更简洁一些?我正在阅读文档here,但无法立即看到一种基于组计数进行过滤的方法。

由于I和J的总计数均小于6K,我该如何过滤钻石以排除包含I或J的行?

1 个答案:

答案 0 :(得分:-1)

我们可以在分组步骤之后直接使用filter

library(dplyr)
diamonds %>% 
      group_by(color) %>% 
      filter(n() > 6000)