我有很多有价值的小标题。我知道某些值是“错误的”,因为它们在数据中被过多地表示。
我想做的是过滤掉出现次数超过10次的任何值。
我可以通过
轻松获得发生次数values %>% group_by(value) %>% summarize(count=n())
# A tibble: 1,000 x 2
value count
<dbl> <int>
1 1.40e15 1
2 1.40e15 2
3 1.40e15 1
4 1.40e15 17
5 1.40e15 2
6 1.40e15 7
7 1.40e15 1
但是我现在如何过滤原始values
的小标题,以删除摘要中出现超过10次的任何值?