R数据帧:行间计算

时间:2012-12-21 03:39:52

标签: r time-series

这是Subtract previous year's from value from each grouped row in data frame的扩展。使用plyr的选项非常有意义。

现在,我正在尝试添加更多列。我也修改了一年,所以这是一个实际的年份,有不同的起点由id。以下是制表符分隔的df:https://dl.dropbox.com/u/9699533/df.txt

的链接

enter image description here

当我在当前行时,我无法获得指向前一行的指针。我想将它传递给plyr :: transform的函数部分。我该怎么写呢?谢谢!

备用数据帧输入〜

> dput(df)
structure(list(id = c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L, 4L, 
4L, 4L, 5L, 5L, 5L), value = c(6L, 16L, 21L, 5L, 10L, 26L, 2L, 
12L, 26L, 9L, 16L, 26L, 2L, 15L, 29L), year = c(2007L, 2008L, 
2009L, 2011L, 2012L, 2013L, 2004L, 2004L, 2006L, 2010L, 2011L, 
2012L, 2014L, 2015L, 2016L), actual = c(6L, 10L, 5L, 5L, 5L, 
16L, 2L, 10L, 14L, 9L, 7L, 10L, 2L, 13L, 14L)), .Names = c("id", 
"value", "year", "actual"), class = "data.frame", row.names = c(NA, 
-15L))

1 个答案:

答案 0 :(得分:3)

请勿使用transform

foo <- function(x){
   x$ratio <- c(NA,tail(x$actual,-1)/head(x$value,-1))
   x
 }
> 
> ddply(df,.(id),foo)
   id value year actual     ratio
1   1     6 2007      6        NA
2   1    16 2008     10 1.6666667
3   1    21 2009      5 0.3125000
4   2     5 2011      5        NA
5   2    10 2012      5 1.0000000
6   2    26 2013     16 1.6000000
7   3     2 2004      2        NA
8   3    12 2004     10 5.0000000
9   3    26 2006     14 1.1666667
10  4     9 2010      9        NA
11  4    16 2011      7 0.7777778
12  4    26 2012     10 0.6250000
13  5     2 2014      2        NA
14  5    15 2015     13 6.5000000
15  5    29 2016     14 0.9333333

如果我们可以假设您的数据框已经排序,并且我们知道每个组的大小(id),我们甚至不需要执行整个拆分应用程序:

df$ratio2 <- with(df,c(NA,tail(actual,-1) / head(value,-1)))
df$ratio2[seq(1,nrow(df),by = 3)] <- NA