> diamonds %>% group_by(color) %>% tally %>% arrange(desc(n))
# A tibble: 7 x 2
color n
<ord> <int>
1 G 11292
2 E 9797
3 F 9542
4 H 8304
5 D 6775
6 I 5422
7 J 2808
我想过滤钻石以排除总计数小于6K的所有组。
我当时想我可以按nest()
然后按unnest()
进行分组,但想知道是否有使用窗口函数进行过滤的代码更简洁一些?我正在阅读文档here,但无法立即看到一种基于组计数进行过滤的方法。
由于I和J的总计数均小于6K,我该如何过滤钻石以排除包含I或J的行?
答案 0 :(得分:-1)
我们可以在分组步骤之后直接使用filter
library(dplyr)
diamonds %>%
group_by(color) %>%
filter(n() > 6000)