R中的多元回归:协变对因子的影响还是相反?

时间:2017-11-28 08:54:11

标签: r regression linear-regression lm

据我所知,对于具有统计背景的人来说,这可能是一个非常简单的问题。然而,我找不到适合我(不是那样)特殊情况的明确答案:(

我有一个回归模型,有两个分类预测因子(A,有两个级别A1和A2和B,有两个级别B1和B2),还有一个数字预测器Z.

我对Z和B之间的相互作用感兴趣,但特别是A级(A1,我的参考水平)的一个级别。

因此,我拟合了以下模型:

lm(Y ~ A/B*Z, data=df)

这将返回以下内容:

Fixed effects:
              Estimate Std. Error         df t value Pr(>|t|)    
(Intercept)   -0.80420    0.02185 3160.00000 -36.811  < 2e-16 ***
A2             1.55943    0.02968 3160.00000  52.541  < 2e-16 ***
Z              0.07688    0.02561 3160.00000   3.002 0.002706 ** 
A1:B2          0.12481    0.03413 3160.00000   3.657 0.000259 ***
A2:B2         -0.09231    0.03500 3160.00000  -2.637 0.008397 ** 
A2:Z           0.05906    0.03072 3160.00000   1.923 0.054590 .  
A1:B2:Z       -0.06872    0.03959 3160.00000  -1.736 0.042668 *  
A2:B2:Z        0.01222    0.03385 3160.00000   0.361 0.718208    

我认为对我来说特别感兴趣的3行是:

Z              0.07688    0.02561 3160.00000   3.002 0.002706 ** 
A1:B2          0.12481    0.03413 3160.00000   3.657 0.000259 ***
A1:B2:Z       -0.06872    0.03959 3160.00000  -1.736 0.042668 *  

据我所知,第一行代表我的结果Y和线性预测Z之间的线性关系,在我的参考水平A1B1(,并且这不是&#34;主效应&#34; )。因此,我们可以说这两者之间存在正线性关系。

此外,从A1B1到A1B2(第二行)会导致Y显着增加。

第三行是我的问题。这是否说:

  1. 对于Z的每次增加,&#34; B2&#34; (第二行) 减少(约为0.12-0.06=0.6)?
  2. 或者在B2中,Z(第一行)的效果是 明显更小(约为0.07-0.06=0.1)?
  3. 对我来说更令人困惑的是,如果我在公式中交换这些变量,结果是相同的:

    lm(Y ~ A/Z*B, data=df)
    
    Fixed effects:
                  Estimate Std. Error         df t value Pr(>|t|)    
    ...
    B2             0.12481    0.03413 3160.00000   3.657 0.000259 ***
    A1:Z           0.07688    0.02561 3160.00000   3.002 0.002706 ** 
    ...
    A1:Z:B2       -0.06872    0.03959 3160.00000  -1.736 0.082668 .  
    ...
    

1 个答案:

答案 0 :(得分:1)

实际上,如果我理解你的问题,你应该将你的结果的A1:B2:Z行解释为:A==A1B==B1,然后增加Z 1使Y减少0.06872。

了解这种减少仅仅增加Z的影响是很重要的(0.07688)。在这种情况下,互动A2:Z( - 0.09231)并不重要A!=A1。由于相互作用,Z的效果会根据我的变量AB的值而变化。

这里有一个像这样的线性模型:

Y = int + A2 + Z + A1:B2 + A2:B2 + A2:Z + A1:B2:Z + A2:B2:Z


Y = -0.80420 + 1.55943*A2 + 1.55943*Z + 0.12481*A1:B2 - 0.09231*A2:B2 + 0.05906*A2:Z - 0.06872*A1:B2:Z + 0.01222*A2:B2:Z    

其中A1A2B1B2是取0或1的变量或特定观察值。将所有这些变量替换为您正在寻找的正确值并解决方程式。对于B的影响:

Y = -0.80420 + 1.55943*0 + 1.55943*Z + 0.12481*1*B2 - 0.09231*0*B2 + 0.05906*0*:Z - 0.06872*1*B2:Z + 0.01222*0*B2:Z 
Y = -0.80420 + 1.55943*Z + 0.12481*B2 + 0.06872*B2:Z

所以如果B==B1,那么B2==0

Y = -0.80420 + 1.55943*Z + 0.12481*0 + 0.06872*0:Z
Y = -0.80420 + 1.55943*Z

因此增加了1.55943的Y,增加了一个Z

如果是B==B2,那么B2==1

Y = -0.80420 + 1.55943*Z + 0.12481*1 + 0.06872*1:Z
Y = 0.92901 + 1.62815*Z

因此增加了1.62815的Y,增加了一个Z

它被解释为:B==B2时,Z的影响更为重要。

注意:更改模型的顺序不应该有任何效果。