从pandas中的每个其他时间戳减去每个组的最小时间戳

时间:2017-12-21 18:15:09

标签: python pandas dataframe pandas-groupby

我有一个DataFrame:

   Iter    ID       Time
0   1      A      12:00:00
1   1      B      12:00:01
2   1      C      12:00:01
3   2      B      12:02:00
4   2      A      12:02:02
5   2      C      12:02:06
6   3      C      12:05:01
7   3      B      12:05:00
8   3      A      12:05:05

我想从每个时间戳的偏移量中获取该时间戳的偏移量。

例如,此示例的“Delta”列可能是

   Iter    ID       Time       Delta
0   1      A      12:00:00    00:00:00
1   1      B      12:00:01    00:00:01
2   1      C      12:00:01    00:00:01
3   2      B      12:02:00    00:00:00
4   2      A      12:02:02    00:00:02
5   2      C      12:02:06    00:00:06
6   3      C      12:05:01    00:00:01
7   3      B      12:05:00    00:00:00
8   3      A      12:05:05    00:00:05

我的第一个想法是使用apply,但不知道如何只对Iter组进行操作。

1 个答案:

答案 0 :(得分:3)

使用groupby + transform + min执行此操作,并从Time中减去结果。

df.Time = pd.to_timedelta(df.Time)  # if needed
df['Delta'] = df.Time - df.groupby('Iter').Time.transform('min')

df

   Iter ID     Time    Delta
0     1  A 12:00:00 00:00:00
1     1  B 12:00:01 00:00:01
2     1  C 12:00:01 00:00:01
3     2  B 12:02:00 00:00:00
4     2  A 12:02:02 00:00:02
5     2  C 12:02:06 00:00:06
6     3  C 12:05:01 00:00:01
7     3  B 12:05:00 00:00:00
8     3  A 12:05:05 00:00:05

我已使用pd.to_timedeltaTime转换为Timedelta对象的列(支持其算术运算)。如果Time已经是Timedelta列,请跳过该步骤。