Sklearn:MinMaxScaler是正确的工具吗?

时间:2019-06-26 10:41:15

标签: python pandas machine-learning scikit-learn facebook-prophet

我使用Prophet来预测现场活动(音乐会)的门票销售。到目前为止,我只参与一个活动。为了改善预测,我希望从与我计划预测的音乐会相关的多个音乐会中链接数据。

现在的挑战是,每个事件都有一个不同的最大值。容量。因此,以 event_id 1 出售total_gross的总收入达到10000000,就和 event_id 2 出售5000000的收入一样好(在这种情况下,两者都售罄)。一些样本数据:

id  created                         total_gross event_id    max_capacity
1   2019-03-01 10:57:32.381378+00   18760       1   10000000
2   2019-03-01 10:58:30.93307+00    9380        1   10000000
3   2019-03-01 10:58:45.425421+00   7380        1   10000000
4   2019-03-01 10:59:11.588687+00   14760       1   10000000
5   2018-03-01 11:14:15.630797+00   7380        2   5000000
6   2018-03-01 11:14:25.308153+00   36900       2   5000000
7   2018-03-01 11:14:34.781773+00   7380        2   5000000

在我的drawing上,您可以在缩放前的顶部看到“缩放之前”,缩放后的底部可以看到红色。我不知道现在什么是“转换”我的数据的正确方法。 MinMaxScaler是正确的工具吗?我可以像这里一样简单地将这些数组传递给它吗?

np.array([[ total_gross, max_capacity_event_1],
         [ total_gross2,  max_capacity_event_1],
         [ total_gross, max_capacity_event_2],
         [...]])

0 个答案:

没有答案