获得滚动平均值,该平均值将针对另一个列值进行重置

时间:2019-05-13 09:10:34

标签: python pandas bigdata mean rolling-computation

我有以下数据框:

    store   week    6_m_avg w_sales_qty laged_1
item                    
1065594 101 2016-12-26  NaN 1.0 NaN
1065594 101 2017-01-02  NaN 5.0 1.0
1065594 101 2017-01-09  NaN 6.0 5.0
...

1065594 101 2017-10-23  7.576923    2.0 5.0
1065594 101 2017-10-30  7.346154    6.0 2.0

...

1065594 101 2018-12-10  4.692308    1.0 2.0
1065594 101 2018-12-17  4.615385    1.0 1.0
1065594 101 2018-12-24  4.538462    3.0 1.0
1065594 101 2018-12-31  4.500000    5.0 3.0
1065594 103 2016-12-26  4.230769    1.0 3.0
1065594 103 2017-01-02  4.076923    5.0 1.0
1065594 103 2017-01-09  4.076923    7.0 5.0
1065594 103 2017-01-16  4.230769    10  7.0
1065594 103 2017-01-23  4.461538    12  10
1065594 103 2017-01-30  4.653846    2.0 12

我要计算2个特征:

  • 滞后值
  • 滚动平均值

我希望滚动按商品按商店独立:因此,当商店从101更改为103时,我想重置滚动窗口并重新开始。

与滞后值相同,我希望将商店从101更改为103时的第一个值是 NaN ,而不是101商店中商品的最后一个值。

>

数据集很大(1900万行),我试图旋转数据集,但是我似乎花了很多时间。

感谢您的帮助!

0 个答案:

没有答案