假设我有一个数据框列表ldf:
df1 <- data.frame(date = c(1,2), value = c(4,5))
df2 <- data.frame(date = c(1,2), value = c(4,5))
ldf <- list(df1, df2)
按日期获取值的总和(或任何其他函数)的最佳方法是什么,即某些数据框如:
data.frame(date = c(1,2), value = c(8,10))
答案 0 :(得分:2)
您可以使用:
library(data.table)
dt1 <- rbindlist(ldf)
setkey(dt1,'date')
dt1[,list(value=sum(value)), by='date']
date value
1: 1 8
2: 2 10
答案 1 :(得分:1)
如果这些行都在同一个数据框中,您可以使用aggregate
来计算总和。您可以将它们与rbind
结合使用,以便它们位于相同的数据框中:
aggregate(value ~ date, data=do.call(rbind, ldf), FUN=sum)
date value
1 1 8
2 2 10
如果所有数据框中的date
列都相同,您可以轻松使用Reduce
来完成总和:
Reduce(function(x, y) data.frame(date=x$date, value=x$value+y$value), ldf)
date value
1 1 8
2 2 10
这应该比rbind
将数据加在一起并聚合快得多。
答案 2 :(得分:0)
另一种选择是通过“dplyr”将“tidyr”中的unnest
与典型的分组和聚合函数结合使用:
library(dplyr)
library(tidyr)
unnest(ldf) %>%
group_by(date) %>%
summarise(value = sum(value))
# Source: local data frame [2 x 2]
#
# date value
# 1 1 8
# 2 2 10