将每月数据汇总到季度(平均值)

时间:2019-03-22 14:57:25

标签: r date time-series aggregate average

我有数据,其中包含多个每月变量。我想将这些变量汇总到季度水平。我的初始数据是:

Time           A      B      C     D  . . . . . K
Jan-2004       42     57     53    28
Feb-2004       40     78     56    28
Mar-2004       68     77     53    20
Apr-2004       97     96     80    16
May-2004       84     93     76    17
Jun-2004       57     100    100   21
Jul-2004       62     100    79    22
. 
.
.
.
N

因此,目标是将季度计算为月平均值(sum(jan + feb + mar)/ 3)。换句话说,目标是最终获得如下数据:

Time        A       B      C       D    . . . . . K
2004Q1      50,0   70,7   54,0    25,3
2004Q2      79,3   96,3   85,3    18,0
2004Q3
.
.
.
N

有人可以帮助我解决这个问题吗?

非常感谢您。

2 个答案:

答案 0 :(得分:1)

一种选择是使用yearqtr中的as.yearqtr将'Time'转换为zoo类,并执行summarise_all

library(zoo)
library(dplyr)
df1 %>% 
    group_by(Time = format(as.yearqtr(Time, "%b-%Y"), "%YQ%q")) %>%
    summarise_all(mean)
# A tibble: 3 x 5
#  Time       A     B     C     D
#  <chr>  <dbl> <dbl> <dbl> <dbl>
#1 2004Q1  50    70.7  54    25.3
#2 2004Q2  79.3  96.3  85.3  18  
#3 2004Q3  62   100    79    22  

数据

df1 <- structure(list(Time = c("Jan-2004", "Feb-2004", "Mar-2004", "Apr-2004", 
"May-2004", "Jun-2004", "Jul-2004"), A = c(42L, 40L, 68L, 97L, 
84L, 57L, 62L), B = c(57L, 78L, 77L, 96L, 93L, 100L, 100L), C = c(53L, 
56L, 53L, 80L, 76L, 100L, 79L), D = c(28L, 28L, 20L, 16L, 17L, 
21L, 22L)), class = "data.frame", row.names = c(NA, -7L))

答案 1 :(得分:1)

data.table具有quarter功能,您可以执行以下操作:

library(data.table)
setDT(my_data)

my_data[ , lapply(.SD, mean), by = .(year = year(Time), quarter = quarter(Time))]

这是要点。要使其正常工作,需要reproducible example