我正在尝试编写一个代码来计算以下两个方程式:
到目前为止,我有以下代码:
set.seed(123)
a = rnorm(100, 0, 0.02)
b = rnorm(100, 0, 0.03)
c = rnorm(100, 0, 0.04)
dt = cbind(a, b, c)
wg = runif(ncol(dt))
wg = wg/sum(wg)
wg = round(wg, digits = 3)
options(scipen = 999)
cv = cov(dt)
VARs = diag(cv)
cr = cor(dt)
length(wg)
sum_1 = 0
for (i in 1 : length(wg) ) {
for (j in min(i+1, length(wg)) ) {
sum_1 = sum_1 + 2 * wg[i] * wg[j] * cr[i, j]
}}
rho_1 = sum_1/(1 - sum(wg^2))
sum_2 = 0
for (i in 1 : length(wg) ) {
for (j in min(i+1, length(wg)) ) {
sum_2 = sum_2 + 2 * wg[i] * wg[j] * sqrt(VARs[i]) * sqrt(VARs[j])
}}
PV = t(wg) %*% cv %*% wg
ss = sum(wg^2 * VARs)
rho_2 = (PV - ss)/sum_2
rhos = c(rho_1, rho_2)
rhos
[1] 1.388473356 -0.004104948
我预计这两者会彼此接近。我想我的代码可能有错误。如果有人可以验证代码,我将不胜感激。
感谢。
感谢李哲源哲哲的代码,我模拟了这两个相关度量的100个观察结果,它们确实似乎彼此接近:
答案 0 :(得分:2)
麻烦总结的矢量化能力。
第一个等式:
# double summation in numerator (including multiplier 2)
diag(cr) <- 0
double_sum.1 <- c(crossprod(wg, cr %*% wg))
# single summation in denominator
single_sum.1 <- c(crossprod(wg))
# result
double_sum.1 / (1 - single_sum.1)
第二个等式:
dcv <- sqrt(diag(cv))
# single summation in numerator
single_sum.2 <- c(crossprod(wg * dcv))
# double summation in denominator (including multiplier 2)
double_sum.2 <- sum(tcrossprod(wg * dcv)) - single_sum.2
# result
PV <- c(crossprod(wg, cv %*% wg))
(PV - single_sum.2) / double_sum.2
修复原始循环:
i in 1:(length(wg)-1)
j in (i+1):length(wg)
在我看来,这两个方程式不应该给出接近的结果。
为了看到这一点,我们现在在您的示例中使用真正的协方差矩阵和真正的相关矩阵。当您生成3组独立的正态样本时,它们将具有对角协方差矩阵和同一性相关矩阵:
dcv <- c(0.02, 0.03, 0.04)
cr <- diag(3)
这立即暗示第一个等式给出0.但第二个等式是(做快速的文书工作)
sum_i (1 - w_i) ^ 2 * sigma_i^2
这怎么可能为零?