R:滚动/移动平均线按月分割

时间:2014-10-29 19:57:45

标签: r ggplot2 dataframe plyr dplyr

我正在尝试按月计算滚动/移动平均线。例如,使用ggplot2包中的经济数据,我想构建一个附带的时间序列,表示每个月的3年滚动平均值。

library(ggplot2)
df = economics
df$month =  as.POSIXlt(df$date)$mon+1

当我手动分成月度数据时,我得到了我想要的东西:

library(zoo)
df.test = subset(df, month==1)
df.test$uempmed.ma = rollapply(df.test$unemploy,  width=3, FUN=mean, na.rm=T, 
                               fill=NA, align="right") 


  head(df.test)

         date   pce    pop psavert uempmed unemploy year month uempmed.ma
8  1968-01-31 534.7 199920     9.5     4.5     3001 1968     1         NA
20 1969-01-31 590.2 201881     6.5     4.9     2692 1969     1         NA
32 1970-01-31 635.7 204008     8.1     4.5     3453 1970     1   3048.667
44 1971-01-31 681.3 206668     9.9     6.3     4903 1971     1   3682.667
56 1972-01-31 738.4 209061     9.4     6.6     4928 1972     1   4428.000
68 1973-01-31 828.5 211120     9.5     5.2     4452 1973     1   4761.000

但是,当我尝试使用plyr包同时做几个月......

library(plyr)
df2 = ddply(df, .(month), mutate,
            uempmed.ma = rollapply(df$uempmed,  3, FUN=mean, na.rm=T, 
                                   fill=NA, align="right") 
)

....返回以下错误:

Error: wrong result size (478), expected 40 or 1

我知道这应该相当容易,但我很难过。

最终,我希望移动平均线系列(即uempmed.ma)滞后 - 也就是说,不包括计算中的当前年份。例如,1971-01-31从上面的值应该是1968-01-31,1969-01-31和1970-01-31时间段的uempmed的平均值。

非常感谢任何协助。

1 个答案:

答案 0 :(得分:7)

dplyr(新一代plyr)似乎有用

library(zoo)
library(dplyr)
df %>%
  group_by(month) %>%
  mutate(uempmed.ma = rollapply(unemploy, width = 3, 
         FUN = mean, na.rm = TRUE, fill = NA, align = "right"))

你也可以使用基本R来高效地工作(当然比使用plyr更有效率)

transform(df, uempmed.ma = ave(unemploy, month, 
                               FUN = function(x) rollapply(x, width = 3, 
                                                 FUN = mean, na.rm = TRUE, 
                                                 fill = NA, align = "right")))

或奖励解决方案:使用data.table

library(data.table)
setDT(df)[, uempmed.ma := rollapply(unemploy,  width = 3, 
                          FUN = mean, na.rm = TRUE, fill = NA, 
                          align = "right"), 
          by = month]