泊松预测偏移权重

时间:2016-09-15 13:59:14

标签: r statistics

在Poisson GLM中设置偏移和设置权重之间必须有区别

pois.model = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19]+
                  offset(log(train_claims_ac$Exposition_au_risque)),
                 data=as.data.frame(freq_x_ac), family=poisson(link = log))

sum(predict(pois.model,type='response'))
[1] 2238

这与真实声明完全相同。

但是当我使用权重而不是偏移时:

pois.model2 = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19],
                  weights=train_claims_ac$Exposition_au_risque, 
                  family=poisson(link = log))

sum(predict.glm(pois.model2,type='response'))
[1] 2947.749

当我将此数字乘以曝光并将实际声明与曝光相乘时,我得到了相同的值。但我真的不明白为什么。在我看来,真实的主张已经暴露在风险中,如果是偶然的话就必须分开。

最后,我必须获得年度保费,这是抵消结果除以我猜的曝光。

1 个答案:

答案 0 :(得分:0)

权重和偏移不是一回事,你不应该使用权重进行泊松回归。

此定义中的权重不是每个响应乘以的;它是我们“信任”每次观察的精确度量。与重量较轻的观察结果相比,高重量观察对最终的拟合影响更大。

参见glm docs(强调我的):

  

非NULL权重可用于指示不同的观察值具有不同的分散度(权重值与分散度成反比)...对于二项式GLM,先前的权重用于给出试验次数响应是成功的比例:它们很少用于Poisson GLM