如何比“ for”更快地运行数据帧?

时间:2019-09-23 19:13:08

标签: python pandas dataframe

我需要遍历数据帧的TimeStamp列(逐行)。该数据帧大约有40,000,000行。我正在使用for进行操作,它正在工作。但是,这需要很长时间。我想知道您是否有更快的东西。

index   TimeStamp             FAILURE MESSAGE
0       2018-01-01 00:00:00   'DOOR OPEN'
1       2018-01-01 00:00:01   'DOOR OPEN'
2       2018-01-01 00:00:02   'DOOR OPEN'

代码:

cont = 0
for i in range(0, len(df)):
    if(df['TimeStamp'].iloc[i] >= '2018-01-01 00:00:01'):
        cont +=1

1 个答案:

答案 0 :(得分:1)

我会

(df['Timestamp'] >= pd.Timestamp('2018-01-1 00:00:01')).sum()

对熊猫进行了优化,因此您通常不需要在其上循环