我有数十万条记录,包含该时间段的开始时间,停止时间和活动类型。我希望能够找到与特定的预设时间间隔重叠的总时间,并按活动类型分组。
这就是我所拥有的:
start stop activity
2015-12-24 12:55:00.000 2015-12-24 13:25:00.000 a
2015-12-24 13:45:00.000 2015-12-24 13:59:00.000 b
2015-12-24 13:55:00.000 2015-12-24 14:10:00.000 b
2015-12-24 14:13:00.000 2015-12-24 15:05:00.000 a
这是一个我希望作为最终结果的例子。这显示为半小时分组,但能够指定任何正常时间间隔(白天,小时,半小时,四分之一小时)是理想的:
intervalStart activityMinutes activity
2015-12-24 12:30:00.000 5 a
2015-12-24 13:00:00.000 25 a
2015-12-24 13:30:00.000 19 b
2015-12-24 14:00:00.000 17 a
2015-12-24 14:00:00.000 10 b
2015-12-24 14:30:00.000 30 a
2015-12-24 15:00:00.000 5 a
我有一个SQL查询非常适用于我今年早些时候发布的上一个stackoverflow问题:
但是,在R中使用此查询非常麻烦,并且根据我正在查看的日期范围并不总是有效。它也非常慢,我希望R的解决方案更快,更可靠。
感谢您的帮助,如果我能提供任何其他信息,请告诉我们!
编辑 - 编辑以30分钟间隔时间段显示结果