滚动总和

时间:2019-01-25 12:52:58

标签: r dplyr rolling-sum

如果我有一个数据框,并且我想使用滚动总和来对前n行和后n行求和,那么最好的方法是什么?我知道roll_sum,但是找不到适合我的用例的方法。例如,假设我有一个向量n。我指定我的窗口为1,这意味着对于每个记录,我都希望将其与两个相邻的记录相加。

n   window1
1   NA
3   8
4   12
5   15
6   18
7   22
9   17
1   15
5   6

如果我将窗口大小指定为2,则结果为:

n   window1 window2
1   NA  NA
3   8   NA
4   12  19
5   15  25
6   18  31
7   22  28
9   17  28
1   15  22
5   6   15

有一种简单的方法吗?

2 个答案:

答案 0 :(得分:0)

可能有专用功能,但这似乎可行。它使您可以控制自己的行为方式。例如,lead函数中的default = 0允许它转到最后一条记录,即使没有前导值也是如此。我敢打赌,这是相对缓慢且效率低下的。

library(dplyr)
library(purrr)

rolling_sum <- function(v, window = 1) {

  k <- 1:window

  vLag <- k %>%
    map_dfc(~lag(v, .))

  vLead <- k %>%
    map_dfc(~lead(v, ., default = 0))

  rowSums(bind_cols(vLag, V = v, vLead))

}

df <- data.frame(n = c(1,3,4,5,6,7,9,1,5))

df %>%
  mutate(window1 = rolling_sum(n, 1),
         window2 = rolling_sum(n, 2))

答案 1 :(得分:0)

我认为Zoo包中的rollapplyr是您的朋友。使用align ='center',您可以对前n行和后n行求和。