SARIMAX系列没有时间作为索引,或者如何将行顺序索引作为时间索引?

时间:2018-04-12 05:30:30

标签: pandas time-series prediction statsmodels arima

我有一个大熊猫系列ts数字,我想预测它的未来(接下来的600点)。熊猫系列只是按序列号索引,而不是按日期和时间索引。

以下是ts的示例内容:

    0           1
0   -0.801552   1.0
1   -0.997606   2.0
2   -3.659062   3.0
3   -1.193043   4.0
4   -2.858001   5.0

我跑的时候

statsmodels.tsa.statespace.SARIMAX

使用该系列,我收到以下异常错误:

ValueError('Given a pandas object and the index does not contain dates',)

但根据SARIMAX的文件,第一个论点是:

endog : array_like

The observed time-series process y

似乎它只期望参数是array_like。

如何使该系列与SARIMAX和最终的ARIMA模型一起使用,而无需将日期和时间作为索引?

我在考虑是否可以将行索引伪装成从开始时间开始的几分钟或几秒钟?怎么样?

1 个答案:

答案 0 :(得分:0)

您可以尝试将系列转换为numpy数组。

newts = ts.values

另一种对我有用的方法类似于用时间戳替换索引所暗示的方法。

ts.index = pd.date_range('1/1/2011', periods=72, freq='H')

Here's the documentation for the date_range function.帮助您生成系列所需的确切时间戳。