我已按照说明计算log returns of multiple securities for multiple time period,它可以很好地计算我的数据集的每日回报。现在我的问题从我计算最新日期的月度回报开始。使用公式获得月度回报:
logs=data.frame(
cbind.data.frame(
prices$Date[-1],
na.locf(diff(as.matrix(log(prices[,-1])), lag = 20))
)
)
我得到了:
data.frame(...,check.names = FALSE)中的错误:参数暗示 行数不同:6790,6771
可以理解的是,行号的差异来自我用来获得截至日期的月度回报的20天滞后。我还需要计算截至日期的年度回报,我认为当我这样做时,我也会得到同样的错误。我尝试使用merge.data.frame
代替cbind.data.frame
,但只是导致我的计算机崩溃。
我获取了数据集的前10行和列:
Date `2GO` AAA AB ABA ABG ABS AC ACE ACR
<chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 28-Jun-17 23.25 1.61 14.98 0.37 28.25 42.85 841.5 1.61 1.50
2 27-Jun-17 23.90 1.61 14.98 0.37 27.95 42.90 842.5 1.61 1.53
3 23-Jun-17 24.60 1.61 14.98 0.38 27.00 42.90 840.5 1.70 1.57
4 22-Jun-17 24.40 1.61 14.98 0.37 28.05 43.20 855.0 1.67 1.57
5 21-Jun-17 24.80 1.61 15.00 0.37 28.05 43.10 841.5 1.67 1.57
6 20-Jun-17 25.10 1.61 14.68 0.37 28.85 43.45 858.0 1.70 1.58
7 19-Jun-17 24.85 1.61 14.68 0.37 29.05 43.40 860.0 1.75 1.55
8 16-Jun-17 25.70 1.61 14.68 0.38 29.60 43.45 850.0 1.77 1.52
9 15-Jun-17 26.20 1.61 14.48 0.38 29.55 43.30 867.0 1.69 1.53
10 14-Jun-17 26.85 1.61 16.00 0.37 29.50 43.35 867.5 1.69 1.52
使用Florian提供的代码并使用3作为滞后:
logs=data.frame(
cbind.data.frame(
p$Date[-1],
c(rep(NA,3), na.locf(diff(as.matrix(log(p[,-1])), lag = 3)))
)
)
仍然出错:
data.frame(...,check.names = FALSE)中的错误:参数暗示 不同的行数:9,66
有没有办法解决错误/修复行号?
答案 0 :(得分:0)
根据更新的问题进行编辑。
由于20个周期的滞后确实不存在于初始阶段,因此您可以使用NA填充。问题是na.locf(diff(as.matrix(log(prices[,-1])), lag = 20))
的行数与p = read.table(text="Date `2GO` AAA AB ABA ABG ABS AC ACE ACR
28-Jun-17 23.25 1.61 14.98 0.37 28.25 42.85 841.5 1.61 1.50
27-Jun-17 23.90 1.61 14.98 0.37 27.95 42.90 842.5 1.61 1.53
23-Jun-17 24.60 1.61 14.98 0.38 27.00 42.90 840.5 1.70 1.57
22-Jun-17 24.40 1.61 14.98 0.37 28.05 43.20 855.0 1.67 1.57
21-Jun-17 24.80 1.61 15.00 0.37 28.05 43.10 841.5 1.67 1.57
20-Jun-17 25.10 1.61 14.68 0.37 28.85 43.45 858.0 1.70 1.58
19-Jun-17 24.85 1.61 14.68 0.37 29.05 43.40 860.0 1.75 1.55
16-Jun-17 25.70 1.61 14.68 0.38 29.60 43.45 850.0 1.77 1.52
15-Jun-17 26.20 1.61 14.48 0.38 29.55 43.30 867.0 1.69 1.53
14-Jun-17 26.85 1.61 16.00 0.37 29.50 43.35 867.5 1.69 1.52",header=T)
p=p[order(p$Date),]
logs=data.frame(
cbind.data.frame(
Date = p$Date[4:nrow(p)],
na.locf(diff(as.matrix(log(p[,-1])), lag = 3))
)
)
不同。您应该确保它们的行数相等。例如:
Date X.2GO. AAA AB ABA ABG ABS
7 19-Jun-17 -0.07740807 0 -0.086102699 0.00000000 -0.015371780 0.001152738
6 20-Jun-17 -0.04289156 0 0.013717636 -0.02666825 -0.023973751 0.003458217
5 21-Jun-17 -0.03564734 0 0.021564178 -0.02666825 -0.053785729 -0.008087855
4 22-Jun-17 -0.01827462 0 0.020229955 0.00000000 -0.035029851 -0.004618946
3 23-Jun-17 -0.02012140 0 0.020229955 0.02666825 -0.066273127 -0.012739026
2 27-Jun-17 -0.03696519 0 -0.001334223 0.00000000 -0.003571432 -0.004651171
1 28-Jun-17 -0.04827800 0 0.000000000 0.00000000 0.007104826 -0.008134850
AC ACE ACR
7 -0.008683123 0.034887259 0.019544596
6 -0.010434877 0.005899722 0.032157112
5 -0.010050336 -0.058155920 0.032365285
4 -0.005830920 -0.046792162 0.012820688
3 -0.020607147 0.000000000 -0.006349228
2 0.001187649 -0.036589447 -0.025807884
1 -0.015915455 -0.036589447 -0.045610511
输出:
CxfRsEndpoint
不要忘记检查输出是否符合预期。我只是告诉你为什么代码不工作以及匹配语句中的行数的方法,我不熟悉你正在执行的操作。希望这有帮助!