将ARMA模型拟合到python中按时间索引的时间序列

时间:2016-03-08 06:17:15

标签: python pandas statistics time-series statsmodels

我正在尝试将ARMA模型拟合到存储在pandas数据帧中的时间序列。数据框有一列值为numpy.float64的值,名为" val"和大熊猫时间戳索引。时间戳在"年 - 月 - 日时间:分钟:秒"格式。我理解以下代码:

from statsmodels.tsa.arima_model import ARMA
model = ARMA(df["val"], (1,0))

给我错误信息:

ValueError: Given a pandas object and the index does not contain dates

因为我没有正确格式化时间戳。如何索引我的数据帧,以便ARMA方法接受它同时保留我的日期和时间信息?

1 个答案:

答案 0 :(得分:4)

我认为您需要将index转换为DatetimeIndex

df.index = pd.DatetimeIndex(df.index)

样品:

import pandas as pd
from statsmodels.tsa.arima_model import ARMA

df=pd.DataFrame({"val": pd.Series([1.1,1.7,8.4 ], 
                 index=['2015-01-15 12:10:23','2015-02-15 12:10:23','2015-03-15 12:10:23'])})
print df
                     val
2015-01-15 12:10:23  1.1
2015-02-15 12:10:23  1.7
2015-03-15 12:10:23  8.4

print df.index
Index([u'2015-01-15 12:10:23',u'2015-02-15 12:10:23',u'2015-03-15 12:10:23'], dtype='object')

df.index = pd.DatetimeIndex(df.index)
print df.index
DatetimeIndex(['2015-01-15 12:10:23', '2015-02-15 12:10:23',
               '2015-03-15 12:10:23'],
              dtype='datetime64[ns]', freq=None)

model = ARMA(df["val"], (1,0))
print model
<statsmodels.tsa.arima_model.ARMA object at 0x000000000D5247B8>