如何在dplyr和group_by中使用分位数

时间:2016-06-15 21:16:41

标签: r dplyr

我在下面有这个代码。我正在尝试使用分位数然后按组子集(年份,其中有两个)。我想我可以用dplyr执行此操作,但它不起作用:

Claims6 %>% 
  group_by(year) %>% 
  summarise(ranker = quantile(Expense, prob = c(.10, .30, .50, .80)))

1 个答案:

答案 0 :(得分:17)

您可以使用do功能解决此类问题。我为您生成了一些数据来测试它。

library(dplyr)
Claims6 <- data.frame(year = factor(rep(c(2015, 2016), each = 10)),
                  Expense = runif(20))

Claims6 %>% group_by(year) %>% 
  do(data.frame(t(quantile(.$Expense, probs = c(0.10, 0.30, 0.50, 0.80)))))


Source: local data frame [2 x 5]
Groups: year [2]

    year       X10.      X30.      X50.      X80.
  (fctr)      (dbl)     (dbl)     (dbl)     (dbl)
1   2015 0.06998258 0.2855598 0.5469119 0.9499181
2   2016 0.22983539 0.3691736 0.4754915 0.7058695