将每周时间序列转换为每日时间(按比例标准)

时间:2019-04-28 22:27:05

标签: python pandas datetime

我有一个表示每日产品需求的数据框。 由于该产品的需求是不规则的,因此先知模型的效果不佳,如下所示:

Daily

因此,我将其转换为每周时间序列,并且该模型拟合得更好。

df.resample('W',how={'y': 'sum'}, 
                loffset=pd.offsets.timedelta(days=-6))

Weekly Model

我现在要做什么:

1-再次转换为每日,并遵守此每周的季节性:

Seasonality

工作日优先级:

  1. 星期六
  2. 星期二
  3. 星期五
  4. 星期一
  5. 星期四
  6. 星期三
  7. 周日

因此,如果我对第一周的预测是需求等于3,我希望发生这种情况:

  1. 星期六:1
  2. 星期二:1
  3. 星期五:1
  4. 星期一:0
  5. 星期四:0
  6. 星期三:0
  7. 周日:0

我的意思是,将每周的预测转化为尊重本周的每日顺序以分配值:

         ds      y
0   2018-01-07  5.0
1   2018-01-14  5.0
2   2018-01-21  4.0

预期结果:

         ds      y
0   2018-01-01  1
1   2018-01-02  1
2   2018-01-03  0 (Wednesday)
3   2018-01-04  1
4   2018-01-05  1
5   2018-01-06  1
6   2018-01-07  0 (Sunday)

1 个答案:

答案 0 :(得分:2)

由于您的数据已按日期编入索引,所以我敢打赌它不会那么长。这样我们就可以构造一个函数,apply

def to_daily(val):
    # order of the day in a week
    order = np.argsort([5, 1, 4, 0, 3, 2, 6])

    b, r = val//7, val%7
    ret = np.array([b+1]*r + [b]*(7-r))

    return ret[order]

to_daily(5)
# array([1, 1, 0, 1, 1, 1, 0])

ret_df  = pd.DataFrame({'ds': pd.date_range(df.ds[0]-pd.to_timedelta('6d'),
                                 df.ds.values[-1], freq='d'),
                           'y' : np.array([to_daily(val) 
                                 for val in df.y.astype(int)]).flatten()})
ret_df

输出:

    ds                     y
--  -------------------  ---
 0  2018-01-01 00:00:00    1
 1  2018-01-02 00:00:00    1
 2  2018-01-03 00:00:00    0
 3  2018-01-04 00:00:00    1
 4  2018-01-05 00:00:00    1
 5  2018-01-06 00:00:00    1
 6  2018-01-07 00:00:00    0
 7  2018-01-08 00:00:00    1
 8  2018-01-09 00:00:00    1
 9  2018-01-10 00:00:00    0
10  2018-01-11 00:00:00    0
11  2018-01-12 00:00:00    1
12  2018-01-13 00:00:00    1
13  2018-01-14 00:00:00    0
14  2018-01-15 00:00:00    1
15  2018-01-16 00:00:00    1
16  2018-01-17 00:00:00    1
17  2018-01-18 00:00:00    1
18  2018-01-19 00:00:00    1
19  2018-01-20 00:00:00    2
20  2018-01-21 00:00:00    1