根据R中的行索引计算滚动总和

时间:2015-10-21 23:44:47

标签: r function window

我正在尝试根据窗口大小k计算分组滚动总和但是,如果内部组行索引(n)小于k,我想使用条件k = min计算滚动总和(N,K)。

我的问题类似于这个问题R dplyr rolling sum,但我正在寻找一种为每行提供非NA值的解决方案。

我可以使用dplyr和rollsum获得部分方式:

library(zoo)
library(dplyr)
df <- data.frame(Date=rep(seq(as.Date("2000-01-01"),
            as.Date("2000-12-01"),by="month"),2),
            ID=c(rep(1,12),rep(2,12)),value=1)
df <- tbl_df(df)
df <- df %>% 
        group_by(ID) %>%
        mutate(total3mo=rollsum(x=value,k=3,align="right",fill="NA"))

df
Source: local data frame [24 x 4]
Groups: ID [2]

     Date    ID value tota3mo
   (date) (dbl) (dbl)   (dbl)
1  2000-01-01     1     1      NA
2  2000-02-01     1     1      NA
3  2000-03-01     1     1       3
4  2000-04-01     1     1       3
5  2000-05-01     1     1       3
6  2000-06-01     1     1       3
7  2000-07-01     1     1       3
8  2000-08-01     1     1       3
9  2000-09-01     1     1       3
10 2000-10-01     1     1       3
..        ...   ...   ...     ...

在这种情况下,我想要的是返回2000-01-01观察值1和2000-02-01观察值2。更一般地说,我希望在可能的最大窗口上计算滚动总和但不大于k。

在这种特殊情况下,手动更改某些NA值并不困难。但是,最终我想在我的数据框中添加几个列,这些列将是在各种窗口上计算的滚动总和。在这个更一般的情况下,手动更改许多NA值将变得非常繁琐。

1 个答案:

答案 0 :(得分:3)

使用partial=TRUE的{​​{1}}参数:

rollapplyr

或没有dplyr(仍然需要动物园):

df %>%
   group_by(ID) %>%
   mutate(roll = rollapplyr(value, 3, sum, partial = TRUE)) %>%
   ungroup()