这是我第一次处理时间序列,因此,请原谅。我的数据集包括以下产品ID列和1000种不同的产品,日期列,销售列。由于第一步是执行数据探索(时间序列分解为三个部分-趋势,季节性和随机性),因此我如何在没有附加信息的情况下探索数据,而仅需要产品ID和过去3年的销售额。
基于此数据,我需要构建一组模型,以预测未来4个月的销售量。请帮助我。
从图中可以看出,我试图了解每个时间序列的分布,但是有1000个图,并且很难理解或理解数据,这是我面临的挑战。我想将每个项目的销售数据分为趋势,季节性和随机部分。
我有基本代码,但是不确定如何为多个项目合并相同的代码,以识别每个项目的趋势,季节性和随机性。
我没有其他信息,例如产品类别,销售地区等,只有产品ID,日期和销售信息...
答案 0 :(得分:0)
我不确定您到目前为止还尝试了什么,如果无法为您提供新的可用信息,我深表歉意。
先知本身已经是一个预测模型,所以我假设,您不是在构建机器学习模型,而是在为EDA生成预测数据。
在此阶段,您需要首先确定要从数据中获取什么。如果您确实要预测数据集中产品之一的每个单个产品的性能,那么您将必须找到一种方法来解决对1000个产品分别进行预测的不现实性。但是,即使您确实做到了这一点,在不了解产品类别或每个产品之间的相似性的情况下,结果可能也不会特别有意义。
我的建议是弄清楚您希望EDA回答哪些问题并使用那里的数据。也许您可以选择性能最低的产品并预测其未来的性能。基于此,您可以建议继续销售这些产品是否有任何意义。
如果您正在寻找有关如何使用预测模型的信息,那么可以参考以下一些资源
Predicting the future with Facebook Prophet
An Introduction to Time Series Forecasting with Prophet Package in Exploratory Data Analysis
当然,先知自己的documentation