我们说我有购买和时间两个字段的购买记录。
我想得到的是自第一次不购买以来的第三列时间,所以它看起来像:
buy| time | time difference
1 | 8:00 | NULL
0 | 9:01 | NULL
0 | 9:10 | NULL
0 | 9:21 | NULL
1 | 9:31 | 0:30
0 | 9:41 | NULL
0 | 9:42 | NULL
1 | 9:53 | 0:12
我怎样才能做到这一点?在我看来,它是pd.groupby()和pd.shift()的混合体,但我似乎无法解决这个问题。