数据集的大小如何影响ARIMA预测的准确性?

时间:2019-06-27 12:04:31

标签: python time-series forecasting arima

我有大约15000个条目的数据集。它每10分钟投放一次服务器的免费内存,并且每晚都有更多空间,而每月一次则很少。 如果我将此数据拆分为约75%的火车数据,并希望预测其他25%,则即使火车数据包含以下内容,每个预测步骤的预测也将是一条直线/相同(大约在火车数据的中间)一个非常具体的模式。因此,预测甚至不会紧密交替。

您知道为什么会发生这种情况吗?我尝试了很多不同的模型,包括SARIMA模型,但所有这些都无济于事。 15,000个数据点对于arima而言可能太大了,以致于无法处理吗? 在这张图片中,您可以看到预测与实际数据的比较:https://www.dropbox.com/s/0v6wdtselrspqd8/Capture.PNG?dl=0

如果有人可以告诉我怎么了,我会很高兴! :)

1 个答案:

答案 0 :(得分:0)

我认为您的数据不包含任何强烈的季节性和趋势,因此arima()无法找到准确的预测。

因此,它只是将您的历史数据取平均值并作为预测返回。因此值是相同的(绘制时会得到直线。)