这是Subtract previous year's from value from each grouped row in data frame的扩展。使用plyr的选项非常有意义。
现在,我正在尝试添加更多列。我也修改了一年,所以这是一个实际的年份,有不同的起点由id。以下是制表符分隔的df:https://dl.dropbox.com/u/9699533/df.txt
的链接
当我在当前行时,我无法获得指向前一行的指针。我想将它传递给plyr :: transform的函数部分。我该怎么写呢?谢谢!
〜〜〜〜备用数据帧输入〜〜〜〜〜
> dput(df)
structure(list(id = c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L, 4L,
4L, 4L, 5L, 5L, 5L), value = c(6L, 16L, 21L, 5L, 10L, 26L, 2L,
12L, 26L, 9L, 16L, 26L, 2L, 15L, 29L), year = c(2007L, 2008L,
2009L, 2011L, 2012L, 2013L, 2004L, 2004L, 2006L, 2010L, 2011L,
2012L, 2014L, 2015L, 2016L), actual = c(6L, 10L, 5L, 5L, 5L,
16L, 2L, 10L, 14L, 9L, 7L, 10L, 2L, 13L, 14L)), .Names = c("id",
"value", "year", "actual"), class = "data.frame", row.names = c(NA,
-15L))
答案 0 :(得分:3)
请勿使用transform
。
foo <- function(x){
x$ratio <- c(NA,tail(x$actual,-1)/head(x$value,-1))
x
}
>
> ddply(df,.(id),foo)
id value year actual ratio
1 1 6 2007 6 NA
2 1 16 2008 10 1.6666667
3 1 21 2009 5 0.3125000
4 2 5 2011 5 NA
5 2 10 2012 5 1.0000000
6 2 26 2013 16 1.6000000
7 3 2 2004 2 NA
8 3 12 2004 10 5.0000000
9 3 26 2006 14 1.1666667
10 4 9 2010 9 NA
11 4 16 2011 7 0.7777778
12 4 26 2012 10 0.6250000
13 5 2 2014 2 NA
14 5 15 2015 13 6.5000000
15 5 29 2016 14 0.9333333
如果我们可以假设您的数据框已经排序,并且我们知道每个组的大小(id
),我们甚至不需要执行整个拆分应用程序:
df$ratio2 <- with(df,c(NA,tail(actual,-1) / head(value,-1)))
df$ratio2[seq(1,nrow(df),by = 3)] <- NA