在两部分(障碍)回归模型中编码分段回归项

时间:2014-03-10 00:00:25

标签: r interaction logistic-regression

我使用两部分或障碍模型来给出一组协变量(障碍部分)和另一组coavriates来模拟飞行概率,以模拟模型的负二项式部分。

首先,我迭代地搜索最佳预测变量来解释数据中是否存在零。基于AIC标准选择一个连续预测器和一个二分预测器。然后,我研究了连续预测器的分段术语的使用。连续协变量中的一个断点显着改善了拟合。

以下是分段包

的输出
Estimated Break-Point(s):
   Est. St.Err 
 3.849  1.368 

t value for the gap-variable(s) V:  0 

Meaningful coefficients of the linear terms:
               Estimate Std. Error z value Pr(>|z|)  
(Intercept)     -0.2744     0.3556  -0.772   0.4403  
approach_km     -0.4526     0.2184  -2.072   0.0383 *
sea2             0.3627     0.2280   1.591   0.1117  
U1.approach_km   0.4549     0.2188   2.079       NA  

U1.approach_km系数的斜率是其系数与approach_km系数之间的差值,基本为零。因此,在大于断点的距离处,approach_km不再预测是否存在。

我找到了一种在这些变量中编码的方法,以便将它们添加到障碍模型中,这只是一个基本的glm形式,但是有两组(可能不同的)coavriates由一个|符号。

manual <- glm(occur ~ approach_km + I(pmax(approach_km-3.849,0)) + sea, data=land11, family=binomial)
summary(manual)

Coefficients:
                                Estimate Std. Error z value Pr(>|z|)    
(Intercept)                     -0.27441    0.29347  -0.935    0.350    
approach_km                     -0.45261    0.09993  -4.529 5.92e-06 ***
I(pmax(approach_km - 3.849, 0))  0.45486    0.10723   4.242 2.22e-05 ***
sea2                             0.36271    0.22803   1.591    0.112    

这导致相同的系数估计但是不同的标准。错误。它也导致相同的剩余偏差(均为508.36)和相同的AIC分数516.36,尽管自由度不同(对于分割对象少一个)。

关于如何获得标准的任何想法。错误一致或将此公式输入障碍包时无关紧要

0 个答案:

没有答案