仅当25%的分位数高于给定值时才选择数据

时间:2018-09-24 18:43:45

标签: python pandas numpy

我有一个DataFrame,只有在给定值超过25%时,我才想获取所有数据。

df['RaceRank'].describe()

count    5353.000000
mean      232.257713
std       347.250031
min         1.450000
25%        36.820000
50%        76.500000
75%       271.790000
max      1178.000000
Name: RaceRank, dtype: float64

我尝试了以下方法,但对我没有用:

d = df[df['RaceRank'].quantile(.25)>30]

我相信我不需要以下内容:

d = df[df['RaceRank']>df['RaceRank'].quantile(.25)]

非常感谢

1 个答案:

答案 0 :(得分:0)

IIUC,您可以做类似的事情

mask = df['RaceRank'].quantile(.25) > 30
ones = np.ones(len(df), dtype=bool)

df[mask & ones]