逆向朴素贝叶斯(最有可能引起响应变量的原因)

时间:2019-06-12 01:00:49

标签: time-series data-science naivebayes arima

我正在使用销售的时间序列数据,其中有5种产品A,B,C,D,E,总收入是所有5种产品的收入总和。我的目标是

1)预测下个月我的总收入

2)按产品划分的总收入(每种产品的收入)。

对于第一部分,我使用ARIMA模型来预测下个月的总收入,并且该模型的工作精度相当高。例如,我可以预测,到2019年8月,总收入将达到15万美元。

第二部分,我不知道该如何分解。例如对于$ 150k的细分是产品A:$ 20k,产品B:$ 25k,产品C:$ 50k,产品D:$ 15k,产品E:$ 40k。如果不是一个单一的数字,那么也可以放心使用。

我考虑过的几种方法:

i)为每个产品建立时间序列模型(由于单个产品的数据不足而无法使用)

ii)我认为这个问题是朴素贝叶斯的反面,确定哪个特征最可能是给定响应变量的原因?

要理解该问题,请考虑下表(虚拟值),其中Total是响应变量,我可以很好地预测它。我希望对最后一行进行明智的产品细分。

Month   A   B   C   D   E   Total
18-Jan  546 174 46  284 58  1108
18-Feb  83  257 137 121 425 1023
18-Mar  122 378 505 468 228 1701
18-Apr  454 356 427 424 523 2184
18-May  304 501 318 68  411 1602
18-Jun  530 150 579 100 298 1657
18-Jul  67  408 219 217 59  970
18-Aug  347 166 174 327 129 1143
18-Sep  241 539 285 513 566 2144
18-Oct  385 17  487 354 409 1652
18-Nov  333 358 304 125 292 1412
18-Dec  449 278 595 154 451 1927
19-Jan  228 260 175 55  414 1132
19-Feb  10  202 82  511 299 1104
19-Mar  423 328 278 509 230 1768
19-Apr  15  63  581 85  440 1184
19-May  438 230 467 92  409 1636
19-Jun  ?   ?   ?   ?   ?   1372

有什么建议吗?

0 个答案:

没有答案