我有不平衡的面板数据,并希望在过去36个月中为每个观察采用rowum(MRAR),如列中所示(时间序列"日期"):
dput(ER)
NA, NA, NA, NA, NA, NA, NA, -4.91111111111111, NA, NA, -6,
NA, NA, NA, -1.31111111111111, NA, NA, NA, -5.95555555555556,
-5.73333333333333, -5.75555555555556, -5.86666666666667,
-5.33333333333333, -5.35555555555556, NA, -5.22222222222222,
-5.17777777777778, -5.28888888888889, -5.26666666666667)),
.Names = c("ER.08.2007", "ER.09.2007", "ER.10.2007", "ER.11.2007", "ER.12.2007", "ER.01.2008",
"ER.02.2008", "ER.03.2008", "ER.04.2008", "ER.05.2008", "ER.06.2008",
"ER.07.2008", "ER.08.2008", "ER.09.2008", "ER.10.2008", "ER.11.2008", row.names = c(NA,
-3530L), class = "data.frame")
str(ER)
'data.frame': 3530 obs. of 120 variables:
$ ER.08.2007: num NA NA NA NA NA NA NA NA NA NA ...
$ ER.09.2007: num NA NA NA NA NA NA NA NA NA NA ...
$ ER.10.2007: num NA NA NA NA NA NA NA NA NA NA ...
我尝试了以下内容:
MRAR_3y <- as.data.frame(mat.or.vec(nrow(ER), length(dates)))
for (i in seq(1,length(dates)-36))
{
MRAR_3y[,i] <- rowSums(ER[,c(seq(i,(i+35)))], na.rm=FALSE)
}
所需的MRAR_3y数据帧给出过去36个月ER的总和但是,上面的代码返回以下内容:
> str(MRAR_3y)
'data.frame': 3530 obs. of 120 variables:
$ V1 : num NA NA NA NA NA NA NA NA NA NA ...
$ V2 : num NA NA NA NA NA NA NA NA NA NA ...
$ V59 : num NA NA NA NA NA NA NA NA NA NA ...
$ V60 : num NA NA NA NA NA NA NA NA NA NA ...
$ V61 : num NA NA NA NA -53.9 ...
$ V62 : num NA NA NA NA -55.6 ...
$ V63 : num NA NA NA NA -53.9 ...
$ V64 : num NA NA NA NA -53.7 ...
因此,即使在前36个日期列之前也有一些值。有一些&#34; inf&#34; df中的条目,如果我查看(MRAR_3y)。
这个问题涉及围绕滚动总和的几个主题,即R dplyr rolling sum
非常感谢, Wilhelm Fantastisch
答案 0 :(得分:2)
您可以使用Andrew的示例数据
查看zoo
rollsum
x <- sample(10,100,replace=TRUE)
zoo:rollsum(x,36)
181 181 179 180 180 182 184 183 181 182 187 189 192 191 187 196 200 201
答案 1 :(得分:1)
一种简单的方法是通过差分累积和。这是一个示例,但您需要根据数据进行定制。
x <- sample(10,100,replace=TRUE)
L <- length(x)
W <- 36
cumsum(x)[-c(1:W)] - cumsum(x)[-c((L-W+1):L)]
[1] 181 181 179 187 186 182 176 173 181 173 167 170 175 174 175 181 180 184 186... etc