在Poisson GLM中设置偏移和设置权重之间必须有区别
pois.model = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19]+
offset(log(train_claims_ac$Exposition_au_risque)),
data=as.data.frame(freq_x_ac), family=poisson(link = log))
sum(predict(pois.model,type='response'))
[1] 2238
这与真实声明完全相同。
但是当我使用权重而不是偏移时:
pois.model2 = glm(formula = freq_y_ac~ freq_x_ac[,14] + freq_x_ac[,15]+freq_x_ac[,18]+freq_x_ac[,19],
weights=train_claims_ac$Exposition_au_risque,
family=poisson(link = log))
sum(predict.glm(pois.model2,type='response'))
[1] 2947.749
当我将此数字乘以曝光并将实际声明与曝光相乘时,我得到了相同的值。但我真的不明白为什么。在我看来,真实的主张已经暴露在风险中,如果是偶然的话就必须分开。
最后,我必须获得年度保费,这是抵消结果除以我猜的曝光。
答案 0 :(得分:0)
权重和偏移不是一回事,你不应该使用权重进行泊松回归。
此定义中的权重不是每个响应乘以的;它是我们“信任”每次观察的精确度量。与重量较轻的观察结果相比,高重量观察对最终的拟合影响更大。
参见glm docs(强调我的):
非NULL权重可用于指示不同的观察值具有不同的分散度(权重值与分散度成反比)...对于二项式GLM,先前的权重用于给出试验次数响应是成功的比例:它们很少用于Poisson GLM