我正在使用Python与Sage Maker预测时间序列数据,并且只有月度数据,总共有大约200个数据点,这些数据点不足以进行预测。
例如,我有
Jun 2013, 20, 30, 40
Jul 2013, 23, 33, 43.
如何生成以下内容:
06/01/2013, 20, 30, 40
06/10/2013, 21, 31, 41
06/20/2013, 22, 32, 42
07/01/2013, 23, 33, 43.
答案 0 :(得分:2)
将日期转换为日期时间,然后我们使用resample
interpolate
df.Date=pd.to_datetime(df.Date,format='%b %Y')
df.set_index('Date',inplace=True)
df.resample('10d').mean().interpolate(method='linear',axis=0)
Out[243]:
v1 v2 v3
Date
2013-06-01 20.0 30.0 40.0
2013-06-11 21.0 31.0 41.0
2013-06-21 22.0 32.0 42.0
2013-07-01 23.0 33.0 43.0