使用多变量历史数据预测保险索赔

时间:2017-10-28 18:42:49

标签: time-series forecasting

我有患有特定疾病D的患者的保险索赔数据。

在被诊断患有疾病D后,患者要求进行各种治疗。对于每项索赔,都有关于诊断索赔之后的天数,索赔金额以及一些其他分类变量的数据。

使用这些数据,我必须预测每位患者在未来12个月内要求的数量。

我对时间序列预测没有多少经验,因此我不知道该怎么做。我见过的所有教程都有数据集,其中包含每行数据的日期。

您能否推荐使用哪种建模技术以及如何在其中包含数据?

样本数据图像

enter image description here

1 个答案:

答案 0 :(得分:0)

由于您想预测每位患者在未来12个月内要求的数量,我认为最好的选择是泊松回归而不是时间序列分析。

首先,您的依赖值(y)将是“2个月内患者的索赔”。这里,响应变量是count。

现在,你必须弄清楚影响你的依赖(y)的因素(独立值x)。

您的部分数据属于分类。因此,如果您使用回归技术,最合适的是泊松回归模型。