时间序列预测:使用不同天数的序列需要帮助

时间:2019-05-28 00:51:27

标签: python statistics time-series prediction

我的组织正在运行此事件,我们具有2016年,2017年和2018年的门票销售历史数据。该数据包含考虑了所有销售期间的按天销售的门票数量。

在2019年本次活动中,我被要求对所有日销售期间的日间售票量进行预测,以指导我们度过这段时间,这意味着如果我们能够提供信息,高于或低于预期的销售平均值。

问题在于历史数据在几天内具有不同的销售期限:

2016年,总销售期为46天。 2017年是77天。 在2018年为113天。

2019年,我们计划85天。那么,如何以逻辑/统计方式调整这些历史数据,以便将它们用作统计预测模型(例如ARIMA模型)的输入?

此外,我正计划在Python上执行此操作,因此,如果您对此有任何建议,我也希望听到他们的建议!

谢谢!

1 个答案:

答案 0 :(得分:0)

根据我对您的问题的理解,我将以以下方式解决此问题。

  • 每天查找该事件与那天之间的距离。最大 该值的值在2016年为46,在2017年为77,依此类推。 最长的一天之前。

  • 使用上面的变量以及月份中的某天,一周中的某天 等作为无关变量

  • 此外,使用门票销售的滞后信息。你可以尝试一个 天延迟,一周延迟等。

  • 从销售开始直到您可以生成所有这些数据 结束。

  • 每天将生成的变量用作预测变量并使用票证 将销售作为目标变量并生成机器学习模型 而不是预测。

  • 使用机器学习模型以及生成的变量来预测未来的销售。