我有时间序列,但我没有任何日期。
我知道收集的数据是均匀分布的。
Statsmodel ARIMA假定我必须有日期并抛出以下错误:
ValueError: Given a pandas object and the index does not contain dates
在不知道日期的情况下是否无法使用ARIMA?
答案 0 :(得分:0)
我的数据包含一个.csv文件,如下所示:
286
276
...
239
236
为了使用“statsmodels.tsa.arima_model”软件包,无论出于什么原因我还不清楚(因为据我所知,ARIMA应该能够在没有指定日期的情况下运行),你的DataFrame索引必须在pandas.DatetimeIndex中格式。
我创建了一个频率为一天的虚拟日期,如下所示:
my_data = pd.read_csv('data_2018.csv', header=None)
my_data = my_data.values.flatten()
# create dummy dates for the arima modules....
dates = pd.date_range('1900-1-1', periods=len(my_data), freq='D')
# add the dates and the data to a new dataframe
ts = pd.DataFrame({'dates': dates, 'data': my_data})
# set the dataframe index to be the dates column
ts = ts.set_index('dates')