熊猫-创建多个过滤器并应用于数据框

时间:2020-08-24 11:23:12

标签: python pandas

我为一个数据框创建了多个过滤器:

filt1 = ~df["message"].str.contains("<Media omitted>", na=False),
filt2 = ~df["message"].str.contains("http://", na=False),
filt3 = ~df["message"].str.contains("Dropped pin", na=False), 

我可以使用以下方法过滤数据框:

df[filt1 & filt2 & filt3]

但是当我添加更多过滤器时,这似乎是一种愚蠢的过滤方法。 如何将多个过滤器应用于一个数据框?

我尝试将每个过滤器添加到执行df[filterlist]df[*filterlist]的列表中,但是它们不起作用。

2 个答案:

答案 0 :(得分:3)

您可以使用np.logical_and.reduce

filterlist = [filt1, filt2, filt3]

df[np.logical_and.reduce(filterlist)]

concatDataFrame.all或{{3}}一起测试每行所有True

df[pd.concat(filterlist, axis=1).all(axis=1)]

如果可能,将|用于正则表达式or

filt = ~df["message"].str.contains("<Media omitted>|http://|Dropped pin", na=False)

答案 1 :(得分:0)

您可以使用join合并正则表达式列表

df[~df.message.str.contains('|'.join(filterlist))]
相关问题