使用阈值级别的pandas过滤数据帧

时间:2017-12-21 06:29:37

标签: python pandas

我是熊猫新手,我有一个数据框,df

 Index               eventName        Count      pct     
2017-08-09               ABC           24       95.00%         
2017-09-09               CDE          140       98.50%         
2017-09-22               CDE          150       99.30%         
2017-10-19               DEF          200       20.00%         
2017-10-27               DEF          200       50.00% 

如何根据(50.00%及以上)过滤数据框df而不将列pct作为索引?

2 个答案:

答案 0 :(得分:2)

您可以使用boolean indexing,但条件需要通过切片%str[:-1]来删除replace

df1 = df[df['pct'].str[:-1].astype(float) >= 50]

或者:

df1 = df[df['pct'].replace('%','', regex=True).astype(float) >= 50]
print (df1)
        Index eventName  Count     pct
0  2017-08-09       ABC     24  95.00%
1  2017-09-09       CDE    140  98.50%
2  2017-09-22       CDE    150  99.30%
4  2017-10-27       DEF    200  50.00%

答案 1 :(得分:1)

导入大熊猫 DF = DF [DF [" PCT"> 50.00]