对于每个ID id
,我想应用以下过滤逻辑:
首先确定每个id的最旧时间。 其次,如果以下各行与最早的时间相差少于5分钟,则将其删除。 对于每个ID,从最旧的时间过去5分钟后,找到以下最旧的时间,如果以下几行与该新的最旧时间之间的时差小于5分钟,请再次重复该规则
df
time track id
2018-07-06 08:34:44 1 1
2018-07-06 08:35:46 1 1
2018-07-19 09:15:50 1 1
2018-07-19 09:17:23 1 1
2018-07-06 07:34:44 1 2
2018-07-06 07:36:46 1 2
2018-07-06 07:37:50 1 2
2018-07-06 07:37:53 1 2
预期结果
time track id
2018-07-06 08:34:44 1 1
2018-07-19 09:15:50 1 1
2018-07-06 07:34:44 1 2