我有一个相当大的数据框(几万到几十万行),数据格式如下:
|---------------------|------------------|------------------|
| TAG ID | TXN TIME | LOCATION ID |
|---------------------|------------------|------------------|
| 111114569 | 2019-10-19 00:00 | 19 |
|---------------------|------------------|------------------|
| 100186869 | 2019-10-19 00:01 | 28 |
|---------------------|------------------|------------------|
我需要计算在两个不同位置找到的TAG ID之间的旅行时间;位置19和28。
标签ID不是唯一的,同一标签在一天之内会多次出现,因为它们是车辆路线。
我想要的输出如下:
|---------------------|------------------|------------------|------------------|
| TAG ID | Time at Loc 19 | Time at Loc 28 | Travel Time |
|---------------------|------------------|------------------|------------------|
| 111114569 | 2019-10-19 00:00 | 2019-10-19 00:01 | 00:01 |
|---------------------|------------------|------------------|------------------|
| 100186869 | 2019-10-19 00:01 | 2019-10-19 00:02 | 00:01 |
|---------------------|------------------|------------------|------------------|
我如何最好地利用熊猫的功能呢?