根据另一列的值过滤一列中选定的类别

时间:2019-04-17 11:01:59

标签: python pandas numpy

在使箱形图相对于我的目标连续特征-价格可视化分类特征之后,由于存在许多离群值,因此我想根据价格过滤此分类特征的选择或子集。

我的分类特征是航空公司。假设我想创建一个新的数据框,其中“ Aer Lingus”和“ Ryanair”类别的价格低于1000。

如何根据价格在航空公司中选择和限制这些类别?

irish_airlines= ['Aer Lingus','Ryanair']


df['Price'].loc[df['Airline'].isin(irish_airlines) < 1000]

无效,因为它会返回一系列的所有价格。有任何想法吗?谢谢!

2 个答案:

答案 0 :(得分:0)

&将两个条件约束为按位AND

df[df['Airline'].isin(irish_airlines) & (df['Price'] < 1000)]

答案 1 :(得分:0)

您可以在数据框上“放置”

filter1 = df['Airline'].isin(['Aer Lingus','Ryanair'])
filter2 = df['Price'] < 1000
df = df.where( filter1 & filter2)