Question

在进行了一些数据预处理之后，我坚持合并数据集。我想做的是根据同一批号按行顺序合并以下同一列下的所有日期。通常它是堆叠的数据，然后按照处理步骤（40,42,50）进行了堆叠。然后，我的意图是将两列的时差作为分钟。

数据集：

None

我想要的是

         process     40-------------------42-----------------------50

index   batch   

64177   699042  NaT------------------2019-01-10 18:28:05-------NaT

171272  699042  NaT------------------NaT-------------------- 2019-01-10 18:28:20

120655  699042  2019-01-10 17:40:09--NaT----------------------NaT

120656  699043  2019-01-10 17:40:09--NaT----------------------NaT

67362   699043  NaT------------------2019-01-10 20:43:25-------NaT

168373  699043  NaT------------------NaT-----------------------2019-01-10 20:43:33

Answer 1

您可以尝试将groupby与first

urdf=df.groupby(level=1).first()

合并填充的行单元格而忽略Python中的空单元格

1 个答案: