应用错误收集

数据集的大小如何影响ARIMA预测的准确性？

时间：2019-06-27 12:04:31

标签： python time-series forecasting arima

我有大约15000个条目的数据集。它每10分钟投放一次服务器的免费内存，并且每晚都有更多空间，而每月一次则很少。如果我将此数据拆分为约75％的火车数据，并希望预测其他25％，则即使火车数据包含以下内容，每个预测步骤的预测也将是一条直线/相同（大约在火车数据的中间）一个非常具体的模式。因此，预测甚至不会紧密交替。

您知道为什么会发生这种情况吗？我尝试了很多不同的模型，包括SARIMA模型，但所有这些都无济于事。 15,000个数据点对于arima而言可能太大了，以致于无法处理吗？在这张图片中，您可以看到预测与实际数据的比较：https://www.dropbox.com/s/0v6wdtselrspqd8/Capture.PNG?dl=0

如果有人可以告诉我怎么了，我会很高兴！：）

1 个答案:

答案 0 :(得分：0)

我认为您的数据不包含任何强烈的季节性和趋势，因此arima（）无法找到准确的预测。

因此，它只是将您的历史数据取平均值并作为预测返回。因此值是相同的（绘制时会得到直线。）