R中的聚合数据

时间:2012-06-29 11:55:50

标签: r aggregate

我正在寻找一个关于如何使用aggregate并在R中计算均值的简单例子。

说,我有以下数据框:

A      B
100    85
200    95
300    110
400    105

我想计算某些范围的平均值,结果如下:

RANGE         MEAN
100-200       90
300-400       107.5

我将如何执行此操作,cast()aggregate()

3 个答案:

答案 0 :(得分:14)

假设您的数据框名为“x”:

aggregate(x$B, list(cut(x$A, breaks=c(0, 200, 400))), mean)
#     Group.1     x
# 1   (0,200]  90.0
# 2 (200,400] 107.5

使用“data.table”,您可以执行以下操作:

library(data.table)
as.data.table(x)[, .(RANGE = mean(B)), by = .(MEAN = cut(A, c(0, 200, 400)))]
#         MEAN RANGE
# 1:   (0,200]  90.0
# 2: (200,400] 107.5

答案 1 :(得分:3)

以下是aggregate用法的基本示例。

> foo = data.frame(A=c(100,200,300,400),B=c(85,95,110,105))
> aggregate(foo$B,by=list(foo$A<250),FUN=mean)
  Group.1     B
1   FALSE 107.5
2    TRUE  90.0
> 

答案 2 :(得分:2)

或与cuttapply

相同
 foo <- data.frame(A=c(100,200,300,400),B=c(85,95,110,105))
 tapply(foo$B, cut(foo$A, breaks=seq(0, 400, 200)), mean)
  (0,200] (200,400] 
     90.0     107.5