我试图使用dplyr在数据框中找到变量的平均长度:
Project -> Add Reference...
如何汇总以查找x <- data %>% group_by(Date, `% Bucket`) %>% summarise(count = n())
Date % Bucket count
(date) (fctr) (int)
1 2015-01-05 <=1 1566
2 2015-01-05 (1-25] 421
3 2015-01-05 (25-50] 461
4 2015-01-05 (50-75] 485
5 2015-01-05 (75-100] 662
6 2015-01-05 (100-150] 1693
7 2015-01-05 >150 12359
8 2015-01-13 <=1 1608
9 2015-01-13 (1-25] 441
10 2015-01-13 (25-50] 425
年内每个% Bucket
的平均值?
dplyr
聚合函数将获取dplyr在上面每个桶中找到的计数并将它们相加,除以包含该in base:
x <- as.data.frame(x)
aggregate(count ~ `% Bucket`, data = x, FUN=mean)
% Bucket count
1 <=1 2609.5294
2 (1-25] 449.0000
3 (25-50] 528.7059
4 (50-75] 593.2157
5 (75-100] 763.0000
6 (100-150] 1758.6667
7 >150 12457.9216
变量的行数并给出上面的答案。我怎么能用dplyr完成这个呢?这不是关于完成问题,而是了解如何在这种情况下使用dplyr包。
此类事情的另一个例子是% Bucket
每个summarise
变量的n()
,并列出最小长度&#34; count&#34;该变量在52周内完成。
我正在努力,因为dplyr似乎是为了在列中找到值的平均值而构建的,但是在这里我计算了列中给出变量并尝试查找平均值,最小值,最大值的行出现次数,等等。
答案 0 :(得分:2)
我们可以使用dplyr
方法
library(dplyr)
x %>%
group_by(`% Bucket`) %>%
summarise(count= mean(count))