R:使用交互

时间:2016-05-11 11:58:02

标签: r regression linear-regression quadratic quadratic-curve

我有两个条件的实验数据(二分法IV:'条件')。我还想使用另一个衡量标准的IV(' hh')。我的DV也是指标(' attention.hh')。我已经运行了一个多元回归模型,并且我的IV之间存在交互作用。因此,我通过这样做来集中度量IV:

hh.cen <- as.numeric(scale(data$hh, scale = FALSE))

使用这些变量我进行了以下分析:

model.hh <- lm(attention.hh ~ hh.cen * condition, data = data)
summary(model.hh)

 The results are as follows:

Coefficients:
                Estimate Std. Error t value Pr(>|t|)
 (Intercept)        0.04309    3.83335   0.011    0.991
 hh.cen             4.97842    7.80610   0.638    0.525
 condition          4.70662    5.63801   0.835    0.406
 hh.cen:condition -13.83022   11.06636  -1.250    0.215

然而,我的分析背后的理论告诉我,我应该期望我的度量IV(hh)和DV的二次关系(但仅在一种情况下)。

观察情节,人们至少可以暗示这种关系:

plot

当然,我想从统计上对此进行测试。但是,我现在正在努力如何计算线性回归模型。

我认为有两种解决方案应该是好的,导致不同的结果。不幸的是,我现在还不知道哪个是正确的。我知道,通过将交互(和三向交互)包含在模型中,我还必须包括所有简单/主要效果。

  1. 解决方案:自行包括所有条款:
  2. 因此我首先计算平方IV:

    attention.hh.cen <- scale(data$attention.hh, scale = FALSE)
    

    现在我可以计算线性模型:

    sqr.model.1 <- lm(attention.hh.cen ~ condition + hh.cen + hh.sqr + (condition : hh.cen) + (condition : hh.sqr) , data = data) 
    
    summary(sqr.model.1)
    

    这导致以下结果:

    Call:
    lm(formula = attention.hh.cen ~ condition + hh.cen + hh.sqr + 
        (condition:hh.cen) + (condition:hh.sqr), data = data)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -53.798 -14.527   2.912  13.111  49.119 
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       -1.3475     3.5312  -0.382   0.7037  
    condition         -9.2184     5.6590  -1.629   0.1069  
    hh.cen             4.0816     6.0200   0.678   0.4996  
    hh.sqr             5.0555     8.1614   0.619   0.5372  
    condition:hh.cen  -0.3563     8.6864  -0.041   0.9674  
    condition:hh.sqr  33.5489    13.6448   2.459   0.0159 *
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
    Residual standard error: 20.77 on 87 degrees of freedom
    Multiple R-squared:  0.1335,    Adjusted R-squared:  0.08365 
        F-statistic:  2.68 on 5 and 87 DF,  p-value: 0.02664
    
    1. 解决方案:R包含使用*

      进行交互的所有主要效果

      sqr.model.2&lt; - lm(attention.hh.cen~condition * I(hh.cen ^ 2),data = data)

      摘要(sqr.model.2)

    2. 恕我直言,这也应该没问题 - 但是,输出与上面代码收到的输出不一样

      Call:
      lm(formula = attention.hh.cen ~ condition * I(hh.cen^2), data = data)
      
      Residuals:
          Min      1Q  Median      3Q     Max 
      -52.297 -13.353   2.508  12.504  49.740 
      
      Coefficients:
                            Estimate Std. Error t value Pr(>|t|)  
      (Intercept)             -1.300      3.507  -0.371   0.7117  
      condition               -8.672      5.532  -1.567   0.1206  
      I(hh.cen^2)              4.490      8.064   0.557   0.5791  
      condition:I(hh.cen^2)   32.315     13.190   2.450   0.0162 *
      ---
      Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
      
      Residual standard error: 20.64 on 89 degrees of freedom
      Multiple R-squared:  0.1254,    Adjusted R-squared:  0.09587 
      F-statistic: 4.252 on 3 and 89 DF,  p-value: 0.007431
      

      我宁愿选择1号解决方案,但我不确定。

      也许某人有更好的解决方案或可以帮助我?

0 个答案:

没有答案