Question

我有以下示例数据。我想计算每个唯一ID的保持时间，这与该id的两个时间戳之间没有区别。

例如：（20171116 03：46：17.467893 - 20171116 03：46：16.142514）for id1，（20171116 03：46：17.212341 - 20171116 03：46：16.243121）id2，依此类推。

                   DATETIME   INSTR MODE TYPE  id
0  20171116 03:46:16.142514  INSTR1  ORD  New   1
4  20171116 03:46:17.467893  INSTR1  ORD  CXL   1
1  20171116 03:46:16.243121  INSTR2  ORD  New   2
3  20171116 03:46:17.212341  INSTR2  ORD  TRD   2
2  20171116 03:46:16.758292  INSTR3  ORD  New   3
5  20171116 03:46:18.924825  INSTR3  ORD  TRD   3

有人可以帮助我吗...很多，谢谢你。

Answer 1

首先转换列groupby to_datetime，然后转换df['DATETIME'] = pd.to_datetime(df['DATETIME']) df = df.groupby('id')['DATETIME'] .apply(lambda x: x.iat[-1] - x.iat[0]).reset_index(name='timedelta')，先减去最后一个值：

g = df.groupby('id')['DATETIME']
df = (g.last() - g.first()).reset_index(name='timedelta')

或按GroupBy.last和GroupBy.first减去：

print (df)

   id       timedelta
0   1 00:00:01.325379
1   2 00:00:00.969220
2   3 00:00:02.166533

<% if ((Container.ItemIndex + 1) % 3 == 0) { %> <hr /><% } %>

根据另一列计算两个标记之间的差异

1 个答案: