我有一个表示每日产品需求的数据框。 由于该产品的需求是不规则的,因此先知模型的效果不佳,如下所示:
因此,我将其转换为每周时间序列,并且该模型拟合得更好。
df.resample('W',how={'y': 'sum'},
loffset=pd.offsets.timedelta(days=-6))
我现在要做什么:
1-再次转换为每日,并遵守此每周的季节性:
工作日优先级:
因此,如果我对第一周的预测是需求等于3,我希望发生这种情况:
我的意思是,将每周的预测转化为尊重本周的每日顺序以分配值:
ds y
0 2018-01-07 5.0
1 2018-01-14 5.0
2 2018-01-21 4.0
预期结果:
ds y
0 2018-01-01 1
1 2018-01-02 1
2 2018-01-03 0 (Wednesday)
3 2018-01-04 1
4 2018-01-05 1
5 2018-01-06 1
6 2018-01-07 0 (Sunday)
答案 0 :(得分:2)
由于您的数据已按日期编入索引,所以我敢打赌它不会那么长。这样我们就可以构造一个函数,apply
:
def to_daily(val):
# order of the day in a week
order = np.argsort([5, 1, 4, 0, 3, 2, 6])
b, r = val//7, val%7
ret = np.array([b+1]*r + [b]*(7-r))
return ret[order]
to_daily(5)
# array([1, 1, 0, 1, 1, 1, 0])
ret_df = pd.DataFrame({'ds': pd.date_range(df.ds[0]-pd.to_timedelta('6d'),
df.ds.values[-1], freq='d'),
'y' : np.array([to_daily(val)
for val in df.y.astype(int)]).flatten()})
ret_df
输出:
ds y
-- ------------------- ---
0 2018-01-01 00:00:00 1
1 2018-01-02 00:00:00 1
2 2018-01-03 00:00:00 0
3 2018-01-04 00:00:00 1
4 2018-01-05 00:00:00 1
5 2018-01-06 00:00:00 1
6 2018-01-07 00:00:00 0
7 2018-01-08 00:00:00 1
8 2018-01-09 00:00:00 1
9 2018-01-10 00:00:00 0
10 2018-01-11 00:00:00 0
11 2018-01-12 00:00:00 1
12 2018-01-13 00:00:00 1
13 2018-01-14 00:00:00 0
14 2018-01-15 00:00:00 1
15 2018-01-16 00:00:00 1
16 2018-01-17 00:00:00 1
17 2018-01-18 00:00:00 1
18 2018-01-19 00:00:00 1
19 2018-01-20 00:00:00 2
20 2018-01-21 00:00:00 1