使用groupby对数据帧进行就地修改

时间:2018-02-25 19:50:19

标签: python dataframe

Time(minutes)       ID          start_time     end_time      queue
420                 11            300            400         [00:]
420                 13            400            500         [00:11]
420                 00            200            350         []
421                 11            300            400         [00:]
421                 13            400            500         [00:11]
421                 00            250            300         []

我有一个看起来像这样的数据框,然后我想使用在给定时间可用的start_time和end_time添加队列中的所有持续时间(end_time - start_time)。请注意,start_time和end_time不一定是固定的。它可能会随着时间而改变。我想要的输出是:

Time(minutes)       ID          start_time     end_time      total_duration
420                 11            300            400         150
420                 13            400            500         250
420                 00            200            350         0
421                 11            300            400         50
421                 13            400            500         150
421                 00            250            300         0

群体对这类问题有什么好处吗?或者我应该使用iterrow()并跟踪分钟的变化?问题是我需要每分钟跟踪start_time和end_time,所以理想情况下我可能需要一个字典来存储持续时间键入的客户ID,但我找不到任何有用的文档来groupby进行就地修改。

0 个答案:

没有答案