statsmodels中的AR模型

时间:2018-10-29 22:57:32

标签: python pandas statsmodels

我正在尝试在Python中拟合时间序列自动回归模型

输入DF:

code                                test_col  

2018-09-20 18:00:00                      10                      
2018-09-20 19:00:00                      20                     
2018-09-20 20:00:00                      21                       
2018-09-20 21:00:00                      17                      
2018-09-20 22:00:00                      7 

DF的索引:

DatetimeIndex(['2018-09-20 18:00:00'.......]

型号:

 mod = AR(DF[test_col])
 res = mod.fit(maxlag= 20, ic= 'aic')
 last_hour = df.index[[len(df)-1]]
 pred = res.predict(start=last_hour[0],end = last_hour[0] )

last_hour =>从我要预测的索引中获取最新的时间戳

错误:

File "pandas/tslib.pyx", line 1280, in pandas.tslib._Timestamp.__sub__ (pandas/tslib.c:23914)
TypeError: descriptor '__sub__' requires a 'datetime.datetime' object but received a 'int'

我检查了“ last_hour”的类型

print (type(last_hour))
<class 'pandas.tseries.index.DatetimeIndex'>

有关如何纠正此问题的任何建议。

2 个答案:

答案 0 :(得分:1)

将熊猫从V-19更新到23.解决了该问题。

答案 1 :(得分:0)

我认为日期时间索引在数据框中的转换方式存在问题,因为以下代码行对我有用:

import pandas as pd
from statsmodels.tsa.ar_model import AR
DF = pd.DataFrame({'code': ['2018-09-20 18:00:00', '2018-09-20 19:00:00', '2018-09-20 20:00:00', '2018-09-20 21:00:00', '2018-09-20 22:00:00'],
                   'test_col': [10, 20, 21, 17, 7]})
DF['code'] = pd.to_datetime(DF['code'])
DF = DF.set_index('code')
mod = AR(DF['test_col'])
res = mod.fit(maxlag= 2, ic= 'aic')
last_hour = DF.index[[len(DF)-1]]
pred = res.predict(start=last_hour[0],end = last_hour[0])

检查last_hour对象给出

print(last_hour)
DatetimeIndex(['2018-09-20 22:00:00'], dtype='datetime64[ns]', name='code', freq=None)

要尝试的一件事是reset_index,然后将该列转换为datetime,然后再次将其设置为index。