我有一个df数据框,其中包含每个事件的开始日期和结束日期 例如:
start end
08:08:20 08:09:20
08:08:11 08:13:99
08:09:15 08:10:50
08:11:10 08:12:00
08:11:10 08:13:00
我想要每分钟同时发生的事件数: 我在最小开始和最大结束之间每分钟可能生成一个数据帧df1天线 我要做的是: 如果df.date_fin> df.Time和df.date_deb
我的代码是:
df["nb_events"]=0
for i in range (0,df1.shape[0]):
for j in range (0,df.shape[0]):
if df.end[j]>df1.Time[i]:
if df.start[j]<df1.Time[i]:
df1["nb_events"][i]+=1
所需结果df1:
Time nb_event
.
.
.
08:08:00 2
08:09:00 2
08:10:00 1
08:11:00 2
08:12:00 3
08:13:00 1
.
.
.
我的代码可以正常工作,并且返回期望的结果,除非我要处理大量数据,并且运行时间很长 您能提供另一种方法吗? 谢谢