我是否要从GLM中删除此变量?该变量并不重要,但与另一个变量的交互作用是

时间:2019-04-09 11:37:36

标签: r glm poisson

我正在创建一个具有准泊松分布的GLM,当我分析偏差时,我的一个变量并不重要,但它与另一个变量的相互作用才是重要的。我的理解是,当您期望两者之间存在关系时,您将包括交互,因此,随着一个人的发展,另一个人的发展也将上升。

Worked.out.vol.hours是总时间。 AAB ... BW是组织者。 抱歉,可怕的变量名。

Call:
glm(formula = total.debris ~ Beach.Region + Volunteers..n. * 
    worked.out.vol.hour + Survey.Window + AAB...BW, family = quasipoisson, 
    data = ltype.all)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-128.45   -22.71   -10.72     7.98   242.77  

Coefficients:
                                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)                         6.298e+00  4.650e-01  13.544  < 2e-16 ***
Beach.RegionNorth East              5.523e-01  1.142e-01   4.838 1.36e-06 ***
Beach.RegionNorth West              7.873e-01  1.233e-01   6.385 1.92e-10 ***
Beach.RegionNorthern Ireland        6.919e-01  1.554e-01   4.452 8.77e-06 ***
Beach.RegionScotland                6.168e-01  1.023e-01   6.030 1.80e-09 ***
Beach.RegionSouth East              7.663e-01  9.997e-02   7.665 2.27e-14 ***
Beach.RegionSouth West              8.261e-01  1.008e-01   8.196 3.38e-16 ***
Beach.RegionWales                   6.714e-01  1.104e-01   6.079 1.33e-09 ***
Volunteers..n.                      1.710e-02  1.235e-03  13.852  < 2e-16 ***
worked.out.vol.hour                 3.579e-03  6.620e-04   5.407 6.83e-08 ***
Survey.Window2000                   3.944e-01  1.893e-01   2.083   0.0373 *  
Survey.Window2001                   1.199e-01  1.851e-01   0.647   0.5174    
Survey.Window2002                   1.804e-01  1.773e-01   1.017   0.3090    
Survey.Window2003                   2.789e-01  1.747e-01   1.596   0.1106    
Survey.Window2004                   1.441e-01  1.738e-01   0.829   0.4069    
Survey.Window2005                   1.008e-01  1.722e-01   0.586   0.5581    
Survey.Window2006                   8.810e-02  1.718e-01   0.513   0.6081    
Survey.Window2007                   7.097e-02  1.726e-01   0.411   0.6809    
AAB...BWAAB Combined               -7.903e-01  6.679e-01  -1.183   0.2368    
AAB...BWAdopt a Beach              -6.070e-01  4.234e-01  -1.434   0.1517    
AAB...BWBeachwatch Only            -4.539e-01  4.227e-01  -1.074   0.2829    
AAB...BWBW Combined                -6.548e-01  4.863e-01  -1.347   0.1782    
Volunteers..n.:worked.out.vol.hour -2.232e-05  1.586e-06 -14.071  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for quasipoisson family taken to be 1238.943)

    Null deviance: 3637808  on 3737  degrees of freedom
Residual deviance: 2952919  on 3715  degrees of freedom
AIC: NA

Number of Fisher Scoring iterations: 5

当我运行代码以查看哪些变量很重要anova(actmod1, test="Chisq")

Analysis of Deviance Table

Model: quasipoisson, link: log

Response: total.debris

Terms added sequentially (first to last)


                                       Df Deviance Resid. Df Resid. Dev  Pr(>Chi)    
    NULL                                                3737    3637808              
    Beach.Region                        7   141546      3730    3496262 < 2.2e-16 ***
    Volunteers..n.                      1   255212      3729    3241050 < 2.2e-16 ***
    worked.out.vol.hour                 1     1227      3728    3239823 0.3196126    
    Survey.Window                       8    17788      3720    3222035 0.0729141 .  
    AAB...BW                            4    27536      3716    3194499 0.0001807 ***
    Volunteers..n.:worked.out.vol.hour  1   241579      3715    2952919 < 2.2e-16 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

worked.out.vol.hours在偏差分析中并不重要,但它与志愿者的互动。是的,这是可以预期的,因为随着更多志愿者的参与,调查的总时数自然会增加。但是,我想在模型中将这些值分开。我该如何处理这个问题?我是否要完全删除变量?还是因为互动很重要而保留它?

此外,由于我对此还很陌生,所以对于如何简洁地报告这些值的任何帮助将不胜感激。

0 个答案:

没有答案