在使箱形图相对于我的目标连续特征-价格可视化分类特征之后,由于存在许多离群值,因此我想根据价格过滤此分类特征的选择或子集。
我的分类特征是航空公司。假设我想创建一个新的数据框,其中“ Aer Lingus”和“ Ryanair”类别的价格低于1000。
如何根据价格在航空公司中选择和限制这些类别?
irish_airlines= ['Aer Lingus','Ryanair']
df['Price'].loc[df['Airline'].isin(irish_airlines) < 1000]
无效,因为它会返回一系列的所有价格。有任何想法吗?谢谢!
答案 0 :(得分:0)
按&
将两个条件约束为按位AND
:
df[df['Airline'].isin(irish_airlines) & (df['Price'] < 1000)]
答案 1 :(得分:0)
您可以在数据框上“放置”
filter1 = df['Airline'].isin(['Aer Lingus','Ryanair'])
filter2 = df['Price'] < 1000
df = df.where( filter1 & filter2)