我有以下数据框:
store week 6_m_avg w_sales_qty laged_1
item
1065594 101 2016-12-26 NaN 1.0 NaN
1065594 101 2017-01-02 NaN 5.0 1.0
1065594 101 2017-01-09 NaN 6.0 5.0
...
1065594 101 2017-10-23 7.576923 2.0 5.0
1065594 101 2017-10-30 7.346154 6.0 2.0
...
1065594 101 2018-12-10 4.692308 1.0 2.0
1065594 101 2018-12-17 4.615385 1.0 1.0
1065594 101 2018-12-24 4.538462 3.0 1.0
1065594 101 2018-12-31 4.500000 5.0 3.0
1065594 103 2016-12-26 4.230769 1.0 3.0
1065594 103 2017-01-02 4.076923 5.0 1.0
1065594 103 2017-01-09 4.076923 7.0 5.0
1065594 103 2017-01-16 4.230769 10 7.0
1065594 103 2017-01-23 4.461538 12 10
1065594 103 2017-01-30 4.653846 2.0 12
我要计算2个特征:
我希望滚动按商品按商店独立:因此,当商店从101更改为103时,我想重置滚动窗口并重新开始。
与滞后值相同,我希望将商店从101更改为103时的第一个值是 NaN ,而不是101商店中商品的最后一个值。
>数据集很大(1900万行),我试图旋转数据集,但是我似乎花了很多时间。
感谢您的帮助!