我为一个数据框创建了多个过滤器:
filt1 = ~df["message"].str.contains("<Media omitted>", na=False),
filt2 = ~df["message"].str.contains("http://", na=False),
filt3 = ~df["message"].str.contains("Dropped pin", na=False),
我可以使用以下方法过滤数据框:
df[filt1 & filt2 & filt3]
但是当我添加更多过滤器时,这似乎是一种愚蠢的过滤方法。 如何将多个过滤器应用于一个数据框?
我尝试将每个过滤器添加到执行df[filterlist]
和df[*filterlist]
的列表中,但是它们不起作用。
答案 0 :(得分:3)
您可以使用np.logical_and.reduce:
filterlist = [filt1, filt2, filt3]
df[np.logical_and.reduce(filterlist)]
将concat
与DataFrame.all
或{{3}}一起测试每行所有True
:
df[pd.concat(filterlist, axis=1).all(axis=1)]
如果可能,将|
用于正则表达式or
:
filt = ~df["message"].str.contains("<Media omitted>|http://|Dropped pin", na=False)
答案 1 :(得分:0)
您可以使用join
合并正则表达式列表
df[~df.message.str.contains('|'.join(filterlist))]