我需要遍历数据帧的TimeStamp
列(逐行)。该数据帧大约有40,000,000行。我正在使用for
进行操作,它正在工作。但是,这需要很长时间。我想知道您是否有更快的东西。
index TimeStamp FAILURE MESSAGE
0 2018-01-01 00:00:00 'DOOR OPEN'
1 2018-01-01 00:00:01 'DOOR OPEN'
2 2018-01-01 00:00:02 'DOOR OPEN'
代码:
cont = 0
for i in range(0, len(df)):
if(df['TimeStamp'].iloc[i] >= '2018-01-01 00:00:01'):
cont +=1
答案 0 :(得分:1)
我会
(df['Timestamp'] >= pd.Timestamp('2018-01-1 00:00:01')).sum()
对熊猫进行了优化,因此您通常不需要在其上循环