与前一个时期的两个值之差

时间:2019-07-09 14:34:32

标签: python pandas

我正在使用MTA数据和熊猫,我想计算每天每个报告时间之间的出入差额。每个报告期应从午夜的0开始并从那里开始计数。

我已经计算出每天的最小值和最大值之间的差异,但是我无法计算小时之间的差异。

我的数据框如下:

C/A     UNIT    SCP      STATION  LINENAME  DIVISION        
A002    R051    02-00-00 59 ST    NQR456W   BMT
A002    R051    02-00-00 59 ST    NQR456W   BMT

DATE            TIME          ENTRIES      EXITS  DATETIME
06/29/2019  00:00:00      7116734   2410183   06/29/2019 00:00:00
06/29/2019  08:00:00      7116770   2410218   06/29/2019 08:00:00

这可以计算进入/退出次数,但是粒度不够,而且我不喜欢按日期分组的方式:

sort_on_turnstiles['exit_increments'] = df.groupby(['c/a','unit','scp','station','datetime'])['exits'].apply(lambda x: x.max() - x.min())

理想情况下,我不想按日期分组。

我想通过报告小时数和旋转栅门分组['c / a','unit','scp','station']来创建一个特定的列“ entry_increments” /“ exit_increments”。理想情况下,结果数据框应类似于:

C/A     UNIT    SCP       STATION  LINENAME DIVISION        
A002    R051    02-00-00  59 ST    NQR456W  BMT


DATE            TIME          ENTRIES      EXITS  DATETIME
06/29/2019  00:00:00      7116734   2410183   06/29/2019 00:00:00
06/29/2019  08:00:00      7116770   2410218   06/29/2019 08:00:00

ENTRY_INCS     EXIT_INCS
0              0
36             35

0 个答案:

没有答案