应用错误收集

在Pandas中使用布尔掩码

时间：2013-05-22 09:50:36

标签： python boolean pandas mask

这可能是一个微不足道的查询，但我无法解决。

基本上，我希望能够从下面的数据框中过滤出嘈杂的推文

<class 'pandas.core.frame.DataFrame'>
Int64Index: 140381 entries, 0 to 140380
Data columns:
text          140381  non-null values
created_at    140381  non-null values
id            140381  non-null values
from_user     140381  non-null values
geo           5493  non-null values
dtypes: float64(1), object(4)

我可以根据不需要的关键字创建数据框：

junk = df[df.text.str.contains("Swans")]

但使用它来查看剩下的内容的最佳方式是什么？

2 个答案:

答案 0 :(得分：6)

df[~df.text.str.contains("Swans")]

答案 1 :(得分：1)

您还可以使用以下两个选项：

选项1：

df[-df.text.str.contains("Swans")]

选项2：

import numpy as np 
df[np.invert(df.text.str.contains("Swans"))]