sudo service apache2 restart
sample_size = 100
x1 = rnorm(sample_size, mean = 0, sd = 0.5)
x2 = rnorm(sample_size, mean = 0, sd = 0.5)
x3 = 0.5*x2+rnorm(sample_size, mean = 0, sd = 0.5)
epsilon = rnorm(sample_size, mean = 0, sd = 0.1)
情况1:x1和x2是自变量。 随着样本数量的增加,相关性应变为0。 cor(x1,x2)
案例2:但是看到以x2表示的方程,
y = 0+0.1*x1+0.2*x2+0.3*x3+epsilon
它说beta应该是-0.5
'相关性= beta * var(x)/ var(y)'
相关性= -0.5 * var(x1)/ var(x2)
指出相关性不应为零。
在第二种情况下我哪里出问题了?