我正在分析一个交付单位。我有一个单位工作人员在一天中汇总的数据包总数。
第一列定义Date
,第二列指示Session_start
时间,第三列指示Session_end
时间,第四列指示在该会话中完成的总交付packets
,第五列指示会话长度{ {1}}。我刚刚添加Diff_Time
来表示会话之间的差异。
Session_Type
现在我想将根据会话聚合的上述数据转换为每小时数据,如下所示:
Data Frame: df1
Date Session_start Session_end Packets Diff_Time Session_Type
7/01/2016 00:00:00 03:00:00 6000 3 NIGHT
7/01/2016 04:00:00 06:00:00 5000 2 MORNING
当天的总Data Frame: df2
Date Session_start Session_end Packets Diff_Time Session_Type
7/01/2016 00:00:00 01:00:00 2000(6000/3) 1 NIGHT
7/01/2016 01:00:00 02:00:00 4000(cumsum) 1 NIGHT
7/01/2016 02:00:00 03:00:00 6000 1 NIGHT
7/01/2016 03:00:00 04:00:00 6000 1 NIGHT
7/01/2016 04:00:00 05:00:00 8500 1 MORNING
7/01/2016 05:00:00 06:00:00 11000 1 MORNING
7/01/2016 06:00:00 07:00:00 11000 1 MORNING
.
.
7/01/2016 23:00:00 24:00:00 11000 1 MORNING
= 11000(6000 + 5000),这应该是当天结束时改革后的数据框Packets
的累积总和。
有没有人能指出我朝着正确的方向前进?