如何准确提取数量最多的三个观测值

时间:2019-01-27 09:43:56

标签: r dplyr base

如何仅提取三个观察值,它们是关于某些变量的顶级观察值,例如。计数(以下示例数据中的n var)?我想避免安排行,所以我想可以使用dplyr::min_rank

ex <- structure(list(code = c("17.1", "6.2", "151.5", "78.1", "88.1", 
"95.1", "45.2", "252.2"), id = c(1, 2, 3, 4, 5, 6, 7, 8), n = c(6L, 
5L, 8L, 10L, 6L, 3L, 4L, 6L)), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -8L))

ex %>% 
  filter(min_rank(desc(n)) <= 3)

但是如果有联系,它可以给出3个以上的观察结果。例如,上面的命令返回五行:

# A tibble: 5 x 3
  code     id     n
  <chr> <dbl> <int>
1 17.1      1     6
2 151.5     3     8
3 78.1      4    10
4 88.1      5     6
5 252.2     8     6

然后我该如何准确提取3个观测值? (无论是平局还是返回哪个观察结果)

2 个答案:

答案 0 :(得分:4)

我们可以使用可以将列作为参数的row_number

ex %>% 
  filter(row_number(desc(n)) <= 3)
# A tibble: 3 x 3
#   code     id     n
#   <chr> <dbl> <int>
#1 17.1      1     6
#2 151.5     3     8
#3 78.1      4    10

答案 1 :(得分:1)

在基数R中,我们可以使用

ex[tail(order(ex$n),3), ]