我使用Prophet来预测现场活动(音乐会)的门票销售。到目前为止,我只参与一个活动。为了改善预测,我希望从与我计划预测的音乐会相关的多个音乐会中链接数据。
现在的挑战是,每个事件都有一个不同的最大值。容量。因此,以 event_id 1 出售total_gross的总收入达到10000000,就和 event_id 2 出售5000000的收入一样好(在这种情况下,两者都售罄)。一些样本数据:
id created total_gross event_id max_capacity
1 2019-03-01 10:57:32.381378+00 18760 1 10000000
2 2019-03-01 10:58:30.93307+00 9380 1 10000000
3 2019-03-01 10:58:45.425421+00 7380 1 10000000
4 2019-03-01 10:59:11.588687+00 14760 1 10000000
5 2018-03-01 11:14:15.630797+00 7380 2 5000000
6 2018-03-01 11:14:25.308153+00 36900 2 5000000
7 2018-03-01 11:14:34.781773+00 7380 2 5000000
在我的drawing上,您可以在缩放前的顶部看到“缩放之前”,缩放后的底部可以看到红色。我不知道现在什么是“转换”我的数据的正确方法。 MinMaxScaler
是正确的工具吗?我可以像这里一样简单地将这些数组传递给它吗?
np.array([[ total_gross, max_capacity_event_1],
[ total_gross2, max_capacity_event_1],
[ total_gross, max_capacity_event_2],
[...]])