我正在使用MTA数据和熊猫,我想计算每天每个报告时间之间的出入差额。每个报告期应从午夜的0开始并从那里开始计数。
我已经计算出每天的最小值和最大值之间的差异,但是我无法计算小时之间的差异。
我的数据框如下:
C/A UNIT SCP STATION LINENAME DIVISION
A002 R051 02-00-00 59 ST NQR456W BMT
A002 R051 02-00-00 59 ST NQR456W BMT
DATE TIME ENTRIES EXITS DATETIME
06/29/2019 00:00:00 7116734 2410183 06/29/2019 00:00:00
06/29/2019 08:00:00 7116770 2410218 06/29/2019 08:00:00
这可以计算进入/退出次数,但是粒度不够,而且我不喜欢按日期分组的方式:
sort_on_turnstiles['exit_increments'] = df.groupby(['c/a','unit','scp','station','datetime'])['exits'].apply(lambda x: x.max() - x.min())
理想情况下,我不想按日期分组。
我想通过报告小时数和旋转栅门分组['c / a','unit','scp','station']来创建一个特定的列“ entry_increments” /“ exit_increments”。理想情况下,结果数据框应类似于:
C/A UNIT SCP STATION LINENAME DIVISION
A002 R051 02-00-00 59 ST NQR456W BMT
DATE TIME ENTRIES EXITS DATETIME
06/29/2019 00:00:00 7116734 2410183 06/29/2019 00:00:00
06/29/2019 08:00:00 7116770 2410218 06/29/2019 08:00:00
ENTRY_INCS EXIT_INCS
0 0
36 35