我有以下格式的数据框,其中包含一整天的记录。
Arrival_Time Exit_Time Wait_Time
0 2019-03-26 05:40:30 2019-03-26 05:41:00 00:00:30
1 2019-03-26 05:46:00 2019-03-26 05:48:00 00:02:00
我的任务是计算一天中15分钟间隔的平均等待时间。
因此,我正在考虑添加带有间隔退出时间和订单号的其他列,并使用该列来整理我的数据。如下:
Arrival_Time Exit_Time Wait_Time Interval Int#
0 2019-03-26 05:40:30 2019-03-26 05:41:00 00:00:30 "05:30 - 05:45" 1
1 2019-03-26 05:46:00 2019-03-26 05:48:00 00:02:00 "05:45 - 06:00" 2
我不确定如何执行此操作。我是python的新手,花了我一段时间才弄清楚如何创建上述datetime值。
我最初的想法是:
Def interval(row):
if row['Exit_Time'] <= datetime(2019,3,26,5,45,0):
return ""05:30 - 05:45""
if row['Exit_Time'] <= datetime(2019,3,26,6,0,0):
return "05:45 - 06:00"
#And so on
df['Interval'] = df.apply(interval,axis=1)
然后对于int#
但是这似乎效率很低。
有更好的方法吗?
注意:如果我没有包括任何相关内容,请告诉我-我正在尽最大努力遵循stackoverflow最佳做法。