我有一个熊猫数据框:
start end city
2010-08-08 20:05:00 2010-08-08 22:05:00 NY
2010-08-08 21:05:00 2010-08-08 21:35:00 NY
2010-08-09 08:05:00 2010-08-08 08:55:00 SF
我需要接收数据框,该数据框将按每个城市计算每小时进行一次观测的次数。例如,对于NY,它将在日期2010-08-08的第20小时提供1,在同一日期的第21小时提供1,在第22小时提供1。有时,“开始”和“结束”在同一小时发生,有时在不同的时间。因此,例如,我将得到:
hour city count
2010-08-08 20 NY 1
2010-08-08 21 NY 2
2010-08-08 22 NY 1
2010-08-09 08 SF 1
我尝试使用“重新采样”来完成此操作,但它并不能说明持续时间,即开始和结束之间的差异。
非常感谢您的帮助。