autos["brand"].value_counts(normalize=True)
输出以下内容:
volkswagen 0.211
bmw 0.126
mercedes_benz 0.109
audi 0.099
opel 0.090
ford 0.059
renault 0.038
peugeot 0.028
fiat 0.021
skoda 0.019
seat 0.018
smart 0.017
toyota 0.015
mazda 0.015
citroen 0.014
nissan 0.014
hyundai 0.011
mini 0.011
volvo 0.009
kia 0.008
sonstige_autos 0.007
honda 0.007
mitsubishi 0.007
porsche 0.007
chevrolet 0.006
alfa_romeo 0.006
suzuki 0.006
Name: brand, dtype: float64
我希望以最快/最有效的方式选择归一化价值计数高于3%(0.03)的品牌。
我当然可以创建一个布尔掩码:
brands_bool = brand_percentages > 0.03
然后将其应用于df
,但我想知道是否有更快/更短的方法。