我有以下数据框
df = pd.DataFrame({'ID':['001','002','003','001','002','001'],
'chkin':['2017-01-01','2017-01-02','2017-01-03','2017-01-20','2017-01-15','2017-03-06'],
'chkout':['2017-01-05','2017-01-10','2017-01-04','2017-01-27','2017-01-31','2017-03-10']})
df['chkin'] = pd.to_datetime(df['chkin'])
df['chkout'] = pd.to_datetime(df['chkout'])
我想制作一个名为' previous_visit'的新专栏。通过比较每个ID的列(chkout)中的给定日期和另一列(chkin)中的先前日期。预期的输出应该如下。
ID chkin chkout previous_visit
001 2017-01-01 2017-01-05 NaT
002 2017-01-02 2017-01-10 NaT
003 2017-01-03 2017-01-04 NaT
001 2017-01-20 2017-01-27 2017-01-01
002 2017-01-15 2017-01-31 2017-01-02
001 2017-03-06 2017-03-10 2017-01-20
我认为使用df.groupby('ID').transform(some_custom_function, df)
可能会解决这个问题,但我无法设法获得这样的功能。我可以提出你的建议吗?提前谢谢。
答案 0 :(得分:1)
您可以使用shift
获取之前的值,即
df['prev'] = df.groupby('ID')['chkin'].shift()
输出:
ID chkin chkout prev 0 001 2017-01-01 2017-01-05 NaT 1 002 2017-01-02 2017-01-10 NaT 2 003 2017-01-03 2017-01-04 NaT 3 001 2017-01-20 2017-01-27 2017-01-01 4 002 2017-01-15 2017-01-31 2017-01-02 5 001 2017-03-06 2017-03-10 2017-01-20