在进行了一些数据预处理之后,我坚持合并数据集。我想做的是根据同一批号按行顺序合并以下同一列下的所有日期。通常它是堆叠的数据,然后按照处理步骤(40,42,50)进行了堆叠。然后,我的意图是将两列的时差作为分钟。
数据集:
None
我想要的是
process 40-------------------42-----------------------50
index batch
64177 699042 NaT------------------2019-01-10 18:28:05-------NaT
171272 699042 NaT------------------NaT-------------------- 2019-01-10 18:28:20
120655 699042 2019-01-10 17:40:09--NaT----------------------NaT
120656 699043 2019-01-10 17:40:09--NaT----------------------NaT
67362 699043 NaT------------------2019-01-10 20:43:25-------NaT
168373 699043 NaT------------------NaT-----------------------2019-01-10 20:43:33
答案 0 :(得分:2)
您可以尝试将groupby
与first
urdf=df.groupby(level=1).first()