Question

在Poisson GLM中设置偏移和设置权重之间必须有区别

pois.model = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19]+
                  offset(log(train_claims_ac$Exposition_au_risque)),
                 data=as.data.frame(freq_x_ac), family=poisson(link = log))

sum(predict(pois.model,type='response'))
[1] 2238

这与真实声明完全相同。

但是当我使用权重而不是偏移时：

pois.model2 = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19],
                  weights=train_claims_ac$Exposition_au_risque, 
                  family=poisson(link = log))

sum(predict.glm(pois.model2,type='response'))
[1] 2947.749

当我将此数字乘以曝光并将实际声明与曝光相乘时，我得到了相同的值。但我真的不明白为什么。在我看来，真实的主张已经暴露在风险中，如果是偶然的话就必须分开。

最后，我必须获得年度保费，这是抵消结果除以我猜的曝光。

Answer 1

权重和偏移不是一回事，你不应该使用权重进行泊松回归。

此定义中的权重不是每个响应乘以的;它是我们“信任”每次观察的精确度量。与重量较轻的观察结果相比，高重量观察对最终的拟合影响更大。

参见glm docs（强调我的）：

非NULL权重可用于指示不同的观察值具有不同的分散度（权重值与分散度成反比）...对于二项式GLM，先前的权重用于给出试验次数响应是成功的比例：它们很少用于Poisson GLM

泊松预测偏移权重

1 个答案: