我有患有特定疾病D的患者的保险索赔数据。
在被诊断患有疾病D后,患者要求进行各种治疗。对于每项索赔,都有关于诊断索赔之后的天数,索赔金额以及一些其他分类变量的数据。
使用这些数据,我必须预测每位患者在未来12个月内要求的数量。
我对时间序列预测没有多少经验,因此我不知道该怎么做。我见过的所有教程都有数据集,其中包含每行数据的日期。
您能否推荐使用哪种建模技术以及如何在其中包含数据?
样本数据图像
答案 0 :(得分:0)
由于您想预测每位患者在未来12个月内要求的数量,我认为最好的选择是泊松回归而不是时间序列分析。
首先,您的依赖值(y)将是“2个月内患者的索赔”。这里,响应变量是count。
现在,你必须弄清楚影响你的依赖(y)的因素(独立值x)。
您的部分数据属于分类。因此,如果您使用回归技术,最合适的是泊松回归模型。