计算R中的滚动差

时间:2018-02-10 20:16:08

标签: r dataframe calculated-columns

我正在尝试在数据集中进行滚动差异。我有一张这样的桌子:

Year  Count
2017  5
2017  6
2017  7
2017  6
2017  8

我想得到一个差异列,从第5行开始计算。所以它看起来像这样

Index  Count  Diff
1      5      NA
2      6      NA
3      7      NA
4      6      NA
5      8      NA
6      3      -2
7      4      -2
8      9      2
9      2      -4
10     1      -7

现在我只是将count列子集化并与零结合进行计算。这样做有更整洁的方法吗?

这就是我现在正在做的事情:

a <- df$Count[1:5]
b <- rep(0,5)
df$Count1 <- c(b,a)
df$Diff <- df$Count - df$Count1

4 个答案:

答案 0 :(得分:7)

您可以使用lag中的dplyr,如下所示

library(dplyr)
df$Diff <- df$Count - dplyr::lag(df$Count, n = 5)

答案 1 :(得分:5)

require(data.table)
setDT(df)[, Diff := Count - shift(Count, 5)]

答案 2 :(得分:4)

您可以使用基础R

df$Diff <- c( rep(NA, 5), tail(df$Count, -5) - head(df$Count, -5) )

以下是diff()

的变体
df$Diff <- c(rep(NA, 5), diff(df$Count, lag=5))

答案 3 :(得分:2)

从动物园套餐中试用diff.zoona.fill

library(zoo)
transform(df, diff = na.fill(diff(zoo(Count), 5, na.pad = TRUE), fill = 0))

或者,来自动物园的rollapplyr

transform(df, diff = rollapplyr(Count, 5 + 1, diff, 5, fill = 0))