我有一个DataFrame:
Iter ID Time
0 1 A 12:00:00
1 1 B 12:00:01
2 1 C 12:00:01
3 2 B 12:02:00
4 2 A 12:02:02
5 2 C 12:02:06
6 3 C 12:05:01
7 3 B 12:05:00
8 3 A 12:05:05
我想从每个时间戳的偏移量中获取该时间戳的偏移量。
例如,此示例的“Delta”列可能是
Iter ID Time Delta
0 1 A 12:00:00 00:00:00
1 1 B 12:00:01 00:00:01
2 1 C 12:00:01 00:00:01
3 2 B 12:02:00 00:00:00
4 2 A 12:02:02 00:00:02
5 2 C 12:02:06 00:00:06
6 3 C 12:05:01 00:00:01
7 3 B 12:05:00 00:00:00
8 3 A 12:05:05 00:00:05
我的第一个想法是使用apply,但不知道如何只对Iter组进行操作。
答案 0 :(得分:3)
使用groupby
+ transform
+ min
执行此操作,并从Time
中减去结果。
df.Time = pd.to_timedelta(df.Time) # if needed
df['Delta'] = df.Time - df.groupby('Iter').Time.transform('min')
df
Iter ID Time Delta
0 1 A 12:00:00 00:00:00
1 1 B 12:00:01 00:00:01
2 1 C 12:00:01 00:00:01
3 2 B 12:02:00 00:00:00
4 2 A 12:02:02 00:00:02
5 2 C 12:02:06 00:00:06
6 3 C 12:05:01 00:00:01
7 3 B 12:05:00 00:00:00
8 3 A 12:05:05 00:00:05
我已使用pd.to_timedelta
将Time
转换为Timedelta
对象的列(支持其算术运算)。如果Time
已经是Timedelta
列,请跳过该步骤。