计算旅行时间/匹配熊猫中的非唯一用户标签

时间:2019-10-21 16:51:25

标签: python pandas

我有一个相当大的数据框(几万到几十万行),数据格式如下:

|---------------------|------------------|------------------|
|      TAG ID         |     TXN TIME     |    LOCATION ID   |
|---------------------|------------------|------------------|
|     111114569       | 2019-10-19 00:00 |        19        |
|---------------------|------------------|------------------|
|     100186869       | 2019-10-19 00:01 |        28        |
|---------------------|------------------|------------------|

我需要计算在两个不同位置找到的TAG ID之间的旅行时间;位置19和28。

标签ID不是唯一的,同一标签在一天之内会多次出现,因为它们是车辆路线。

我想要的输出如下:

|---------------------|------------------|------------------|------------------|
|      TAG ID         |  Time at Loc 19  |  Time at Loc 28  |  Travel Time     |
|---------------------|------------------|------------------|------------------|
|     111114569       | 2019-10-19 00:00 | 2019-10-19 00:01 |     00:01        |
|---------------------|------------------|------------------|------------------|
|     100186869       | 2019-10-19 00:01 | 2019-10-19 00:02 |     00:01        |
|---------------------|------------------|------------------|------------------|

我如何最好地利用熊猫的功能呢?

0 个答案:

没有答案