考虑以下DataFrame,在第一列中,我们具有自系统启动以来的时间(微秒),在第二列中,我们具有其他值。 如何找到第二列中的值与某个条件匹配的时间(占总数的百分比)?
161.269965 0.018142
161.470018 0.021820
161.670710 0.073925
161.871526 0.020144
162.105240 0.042607
162.337896 0.042966
162.538761 0.047488
162.771496 0.048468
163.004352 0.056527
163.205215 0.039028
163.437925 0.050128
163.638910 0.053168
163.868374 0.028917
164.069121 0.075242
164.269928 0.063719
164.502714 0.028207
...
726.498849 0.076954
对于上面的DataFrame,我如何才能找到第二列中的值超过0.4
的时间(占总数的百分比)?
答案 0 :(得分:0)
(df[df.columns[1]] > 0.4).mean()
创建一个当列大于.4时为True的系列,否则为False。由于True = 1和False = 0,因此我们只需取平均值即可找到True部分。