我正在一段时间(即几年)内分析销售数据。这些销售数据还取决于一些预测变量(即假期,周末,天气等)。每日计数的范围是0到10.000,并且有些值为零。我面临的问题是选择合适的预测模型,其中包括时间结构和零值的存在。
我最初尝试过一种泊松模型。产生的问题是较大的过度分散。为了处理过度分散,我做了一个拟泊松模型和负二项模型。但是在这里,我遇到了时间序列结构和零预测差的问题(通常,模型的预测能力差)。因此,我考虑了零膨胀的泊松模型(以处理零)。然而,模型选择非常差(因此是预测)。
我希望有人对我的建模问题(以及如何处理ts结构)有一个合适的模型选择的想法。我所做的模型的实际结果不足以提供数据。