我有以下数据框:
df <- data.frame(Return1=c(NA, NA, .03, .04, .05),
Return2=c(.25, .33, NA, .045, .90),
Return3=c(.04, .073, .08, .04, .01))
Return1 Return2 Return3
1 NA 0.250 0.040
2 NA 0.330 0.073
3 0.03 NA 0.080
4 0.04 0.045 0.040
5 0.05 0.900 0.010
我想计算累积回报,但数据框中缺少值。我用过:
cumprod(df+1)-1
获得结果
Return1 Return2 Return3
1 NA 0.2500 0.0400000
2 NA 0.6625 0.1159200
3 NA NA 0.2051936
4 NA NA 0.2534013
5 NA NA 0.2659354
这里的问题是,如果存在NA,则后续行将具有结果NA。有没有办法计算累积回报而没有NA影响下面其余的行?
我想得到结果:
Return1 Return2 Return3
1 NA 0.2500 0.0400000
2 NA 0.6625 0.1159200
3 0.03 NA 0.2051936
4 0.07120 0.7373 0.2534013
5 0.12476 2.3008 0.2659354
我知道PerformanceAnalytics包中的一个名为Return.cumulative的函数,但这只会获得整列的累积回报。
有什么想法吗?
答案 0 :(得分:5)
cumpfun <- function(x){
x[!is.na(x)] <- cumprod(x[!is.na(x)]+1)-1
x
}
sapply(df,cumpfun)
# Return1 Return2 Return3
# [1,] NA 0.2500000 0.0400000
# [2,] NA 0.6625000 0.1159200
# [3,] 0.03000 NA 0.2051936
# [4,] 0.07120 0.7373125 0.2534013
# [5,] 0.12476 2.3008937 0.2659354
请注意,sapply
会返回一个矩阵。如果您需要数据框,可以使用类似as.data.frame(lapply(df, cumpfun))