Tweedie-实际vs预期

时间:2019-05-30 09:26:26

标签: r

R中的Tweedie的实际值和预期值不同

我正在尝试在R中的insuranceData库的'dataCar'数据集上实施Tweedie分布。我已经采用了所有变量并建模了平均严重性(=索赔成本/索赔数量)。但是实际严重程度与预测的有很大不同。我已经使用GLM和tweedie家族来实现它。我使用了电源以及日志链接功能。

out_2_vb <- tweedie.profile( 
severity~veh_value+veh_age+gender+area+agecat
,p.vec=seq(1.0, 2.0, by=0.1) ,data=modified_data_5_vb)

tweedie_model_2_vb<-glm(severity~veh_value+veh_age+gender+area+agecat,
family=tweedie(var.power=1.4,link.power=-0.4),
data=modified_data_5_vb )

modified_data_5_predicted_vb<- 
cbind(test1_initialdata_vb,pred_link_vb,pred_response_vb,pred_terms_vb)

实际的严重程度大多为0,因为大多数保单的索赔为0。但是预测的严重性没有0,与实际的有所不同。尽管我预测的平均严重程度为53,而实际的平均严重程度(排除了99%以上的观察结果)为46。

接下来我该怎么办?我应该如何改进模型?

0 个答案:

没有答案