我有一个平均流量的每日数据矩阵,并希望制作一个显示最大峰值流量的汇总矩阵。以下是我的数据的一些示例:
x<-c(5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100)
flow<-matrix(c(c(rep(1990,365),rep(1991,365),rep(1992,365)),sample(x,(365*3), replace=TRUE)),nrow=(365*3), ncol=2)
我希望汇总矩阵使用第1列中的年份和第2列中该年份的峰值流量事件进行格式化。以下是我希望格式化汇总矩阵的示例。
summary=matrix(, ncol=2, nrow=3)
summary[,1]=c(1990,1991,1992)
答案 0 :(得分:5)
这应该是关闭的:
DF <- as.data.frame(flow)
names(DF) <- c("year", "flow")
DF$year <- as.factor(DF$year)
res <- aggregate(flow ~ year, data = DF, FUN = max)
并给出:
year flow
1 1990 100
2 1991 100
3 1992 100
以数据框的形式。
答案 1 :(得分:1)
dplyr系列函数(基于@Bryans工作):
DF <- as.data.frame(flow)
names(DF) <- c("year", "flow")
group_by(DF, year) %>% summarize(flow = max(flow))
给出:
Source: local data frame [3 x 2]
year flow
1 1990 100
2 1991 100
3 1992 100