我正在尝试使用ARIMA在136年的月降雨量数据集中用python执行单变量时间序列预测。
我的数据集的格式为:
全年降雨
2000-01-01 0
2000-02-01 128.2
2000-03-01 0
2000-04-01 289.3
。 。
我有两个问题。
1)我的预测结果为负值,尽管训练集中没有该值,并且从逻辑上讲降雨值不应为负。我的原始数据图如下。
下面是测试数据和预测值的图表。如您所见,预测值的红色曲线延伸到0以下。
2)由于我有月度数据,因此某些行的降雨量从0变为下个月的直接高值,在这种情况下,当前值不取决于先前的观测值,这是原理自回归。这是造成问题的原因,却不适合我吗?我尝试使用年度数据代替,但是也不能给出合适的结果,使用季度频率会中断数据集区域的实际季风周期。
答案 0 :(得分:0)
该模型为您提供最佳猜测。
它只是根据观察到的输入推断为负的预测值。这是“外部逻辑”出现的地方。只需通过将负值替换为0的函数传递预测即可。