对回归系数进行成对比较

时间:2016-01-21 22:12:21

标签: r statistics regression

使用cor(mydataframe)对数字数据帧进行成对比较相关系数(相关矩阵)是直截了当的。有没有办法对相同变量之间的简单回归分析的斜率进行成对比较做同样的事情?令我失望的是,slope(mydataframe)beta(mydataframe)没有做到这一点。

2 个答案:

答案 0 :(得分:1)

我不知道是否有内置函数,但是编写for循环很容易实现这一点。

pairReg = function(data){
  results = rep(NA, ncol(data)**2)
  counter = 0

  for(i in names(data)){
    for (j in names(data)){
      counter = counter + 1
      if (i ==j) next
      results[counter] = lm(data[,i]~data[,j])$coef[2]
    }
  }
  matrix(results, ncol = ncol(data),byrow=T)  
}

该功能默认为制作对角线NA

示例:

data = data.frame(x1 = rnorm(100,0,1),
              x2 = rnorm(100,0,1),
              x3 = rnorm(100,0,1))
pairReg(data)

可以使用apply()对其进行扩展,以加快速度。

答案 1 :(得分:1)

数据集的协方差矩阵与成对回归斜率之间存在非常直接的关系。通过检查回归方程可以明显看出这一点,任何使用回归的人都应该理解这一点(原谅乳胶不受支持的事实):

\ hat y_i = \ bar y + \ sigma_ {xy} \ frac {\ sigma_y} {\ sigma_x}(x_i - \ bar x)

这意味着简单的线性回归系数是

\ hat \ Beta = \ sigma_ {xy} \ frac {\ sigma_y} {\ sigma_x}

IE-通过两个变量之间“差异”(标准偏差)的差异适当缩放的相关性。

因此,这种转换很简单。答案类似于上面的@Devon,但在回归中添加了

c1 <- cor(data)
c2 <- diag(cov(data)^(1/2))

m <- matrix(NA, nrow= ncol(data), ncol= ncol(data))

for (i in 1:3) {
  for (j in 1:3) {
    m[i,j] <- c1[i,j] * c2[i] / c2[j]
  }
}

# using @devon's data, provided w/o a seed
R> m
            [,1]        [,2]        [,3]
[1,]  1.00000000  0.11334817 -0.05551440
[2,]  0.10722557  1.00000000 -0.04449336
[3,] -0.05077282 -0.04301669  1.00000000