我想在一列中对具有相同值的行求和:
> df <- data.frame("1"=c("a","b","a","c","c"), "2"=c(1,5,3,6,2), "3"=c(3,3,4,5,2))
> df
X1 X2 X3
1 a 1 3
2 b 5 3
3 a 3 4
4 c 6 5
5 c 2 2
对于一列(X2),可以聚合数据以获得具有相同X1值的所有行的总和:
> ddply(df, .(X1), summarise, X2=sum(X2))
X1 X2
1 a 4
2 b 5
3 c 8
如何为X3和除X1以外的任意数量的其他列做同样的事情?
这是我想要的结果:
X1 X2 X3
1 a 4 7
2 b 5 3
3 c 8 7
答案 0 :(得分:26)
ddply(df, "X1", numcolwise(sum))
有关详细信息和示例,请参阅?numcolwise
。
答案 1 :(得分:22)
aggregate
可以使用公式界面轻松完成此操作:
aggregate(. ~ X1, data=df, FUN=sum)
## X1 X2 X3
## 1 a 4 7
## 2 b 5 3
## 3 c 8 7
等效地:
aggregate(cbind(X2, X3) ~ X1, data=df, FUN=sum)
答案 2 :(得分:6)
aggregate
对于这些事情来说是一个很好的功能:
aggregate(df[,-1],df["X1"],sum)
X1 X2 X3
1 a 4 7
2 b 5 3
3 c 8 7
来自plyr的numcolwise
方法的基本R版本:
aggregate(df[,sapply(df,is.numeric)],df["X1"],sum)
答案 3 :(得分:5)
data.table
内存效率和编码优雅的解决方案
library(data.table)
DT <- data.table(df)
DT[, lapply(.SD, sum), by = X1]
.SD
是由X1
的值定义的每个组的data.table的子集。与data.table
包相关联的3个有用的插图。