Pandas - 给定日期列,按ID在另一个列组中查找壁橱上一个日期

时间:2017-10-17 14:33:51

标签: python python-3.x pandas

我有以下数据框

df = pd.DataFrame({'ID':['001','002','003','001','002','001'],
                   'chkin':['2017-01-01','2017-01-02','2017-01-03','2017-01-20','2017-01-15','2017-03-06'],
                   'chkout':['2017-01-05','2017-01-10','2017-01-04','2017-01-27','2017-01-31','2017-03-10']})
df['chkin'] = pd.to_datetime(df['chkin'])
df['chkout'] = pd.to_datetime(df['chkout'])

我想制作一个名为' previous_visit'的新专栏。通过比较每个ID的列(chkout)中的给定日期和另一列(chkin)中的先前日期。预期的输出应该如下。

 ID       chkin      chkout      previous_visit
001    2017-01-01   2017-01-05         NaT
002    2017-01-02   2017-01-10         NaT
003    2017-01-03   2017-01-04         NaT
001    2017-01-20   2017-01-27     2017-01-01
002    2017-01-15   2017-01-31     2017-01-02
001    2017-03-06   2017-03-10     2017-01-20

我认为使用df.groupby('ID').transform(some_custom_function, df)可能会解决这个问题,但我无法设法获得这样的功能。我可以提出你的建议吗?提前谢谢。

1 个答案:

答案 0 :(得分:1)

您可以使用shift获取之前的值,即

df['prev'] = df.groupby('ID')['chkin'].shift()

输出:

   ID      chkin     chkout       prev
0  001 2017-01-01 2017-01-05        NaT
1  002 2017-01-02 2017-01-10        NaT
2  003 2017-01-03 2017-01-04        NaT
3  001 2017-01-20 2017-01-27 2017-01-01
4  002 2017-01-15 2017-01-31 2017-01-02
5  001 2017-03-06 2017-03-10 2017-01-20