我正在尝试在Python中拟合时间序列自动回归模型
输入DF:
code test_col
2018-09-20 18:00:00 10
2018-09-20 19:00:00 20
2018-09-20 20:00:00 21
2018-09-20 21:00:00 17
2018-09-20 22:00:00 7
DF的索引:
DatetimeIndex(['2018-09-20 18:00:00'.......]
型号:
mod = AR(DF[test_col])
res = mod.fit(maxlag= 20, ic= 'aic')
last_hour = df.index[[len(df)-1]]
pred = res.predict(start=last_hour[0],end = last_hour[0] )
last_hour =>从我要预测的索引中获取最新的时间戳
错误:
File "pandas/tslib.pyx", line 1280, in pandas.tslib._Timestamp.__sub__ (pandas/tslib.c:23914)
TypeError: descriptor '__sub__' requires a 'datetime.datetime' object but received a 'int'
我检查了“ last_hour”的类型
print (type(last_hour))
<class 'pandas.tseries.index.DatetimeIndex'>
有关如何纠正此问题的任何建议。
答案 0 :(得分:1)
将熊猫从V-19更新到23.解决了该问题。
答案 1 :(得分:0)
我认为日期时间索引在数据框中的转换方式存在问题,因为以下代码行对我有用:
import pandas as pd
from statsmodels.tsa.ar_model import AR
DF = pd.DataFrame({'code': ['2018-09-20 18:00:00', '2018-09-20 19:00:00', '2018-09-20 20:00:00', '2018-09-20 21:00:00', '2018-09-20 22:00:00'],
'test_col': [10, 20, 21, 17, 7]})
DF['code'] = pd.to_datetime(DF['code'])
DF = DF.set_index('code')
mod = AR(DF['test_col'])
res = mod.fit(maxlag= 2, ic= 'aic')
last_hour = DF.index[[len(DF)-1]]
pred = res.predict(start=last_hour[0],end = last_hour[0])
检查last_hour对象给出
print(last_hour)
DatetimeIndex(['2018-09-20 22:00:00'], dtype='datetime64[ns]', name='code', freq=None)
要尝试的一件事是reset_index,然后将该列转换为datetime,然后再次将其设置为index。