在R中生成移动和变量

时间:2013-07-10 14:25:18

标签: r data-manipulation

我怀疑这是一个带有多种解决方案的简单问题,但我在R中仍然是一个新手,并且详尽的搜索并没有产生与我想要做的事情相符的答案。

由于缺乏更好的术语,我试图在数据框中为变量创建“移动总和”。这些将是3年和5年的总和,滞后一年。因此,1986年观察的5年总和将是1981年,1982年,1983年,1984年和1985年所有先前观察的总和。以下是我想要做的一个例子,其中和变量是观察年前五年内所有x的总和。

country     year      x      x5yrsum
  A         1980      9        NA
  A         1981      3        NA
  A         1982      5        NA
  A         1983      6        NA
  A         1984      9        NA
  A         1985      7        32
  A         1986      9        30
  A         1987      4        36

  .....................

  B         1990      0        NA
  B         1991      4        NA
  B         1992      2        NA
  B         1993      6        NA
  B         1994      3        NA
  B         1995      7        15
  B         1996      0        22

这是不平衡的面板数据。我怀疑ddply是合适的,但我不知道它的确切编码。

任何意见都会受到赞赏。

3 个答案:

答案 0 :(得分:7)

您可以在filter(或实施“split-apply-combine”方法的任何其他功能)中使用ddply

library(plyr)
ddply(DF, .(country), transform, 
          x5yrsum2 = as.numeric(filter(x,c(0,rep(1,5)),sides=1)))

#    country year x x5yrsum x5yrsum2
# 1        A 1980 9      NA       NA
# 2        A 1981 3      NA       NA
# 3        A 1982 5      NA       NA
# 4        A 1983 6      NA       NA
# 5        A 1984 9      NA       NA
# 6        A 1985 7      32       32
# 7        A 1986 9      30       30
# 8        A 1987 4      36       36
# 9        B 1990 0      NA       NA
# 10       B 1991 4      NA       NA
# 11       B 1992 2      NA       NA
# 12       B 1993 6      NA       NA
# 13       B 1994 3      NA       NA
# 14       B 1995 7      15       15
# 15       B 1996 0      22       22

答案 1 :(得分:3)

如果DF是输入的三列数据框,则使用来自动物园的averollapplyr。请注意,我们使用宽度k+1,然后从总和中删除第k + 1个元素,以便排除x的当前值,并且仅将剩余的k值相加:< / p>

library(zoo)

k <- 5
roll <- function(x) rollapplyr(x, k+1, function(x) sum(x[-k-1]), fill = NA)
transform(DF, xSyrsum = ave(x, country, FUN = roll))

给出:

   country year x xSyrsum
1        A 1980 9      NA
2        A 1981 3      NA
3        A 1982 5      NA
4        A 1983 6      NA
5        A 1984 9      NA
6        A 1985 7      32
7        A 1986 9      30
8        A 1987 4      36
9        B 1990 0      NA
10       B 1991 4      NA
11       B 1992 2      NA
12       B 1993 6      NA
13       B 1994 3      NA
14       B 1995 7      15
15       B 1996 0      22

答案 2 :(得分:0)

您还可以使用filter的标准包装(stats)来进行移动总和:

ms=function(x,n=5) as.numeric(stats::filter(x,rep(1, n),method="convolution",sides=1))
x=c(1,2,3,4,5,6,7,8,9)
ms(x,5)
NA NA NA NA 15 20 25 30 35

要执行1-lag,请在开头插入NA并获取元素(或行)的数量:

ms.1lag=c(NA,ms(x,5))[1:length(x)]
cbind(x,ms.1lag)
x ms.1lag
[1,] 1      NA
[2,] 2      NA
[3,] 3      NA
[4,] 4      NA
[5,] 5      NA
[6,] 6      15
[7,] 7      20
[8,] 8      25
[9,] 9      30

如果您经常使用它,

ms=function(x,n=5,lag=0)
  c(rep(NA,lag),
    as.numeric(stats::filter(x,rep(1, n),method="convolution",sides=1)))[1:length(x)]
 cbind(x,ms5.1=ms(x,5,1))
      x ms5.1
 [1,] 1    NA
 [2,] 2    NA
 [3,] 3    NA
 [4,] 4    NA
 [5,] 5    NA
 [6,] 6    15
 [7,] 7    20
 [8,] 8    25
 [9,] 9    30