在Pandas中使用布尔掩码

时间:2013-05-22 09:50:36

标签: python boolean pandas mask

这可能是一个微不足道的查询,但我无法解决。

基本上,我希望能够从下面的数据框中过滤出嘈杂的推文

<class 'pandas.core.frame.DataFrame'>
Int64Index: 140381 entries, 0 to 140380
Data columns:
text          140381  non-null values
created_at    140381  non-null values
id            140381  non-null values
from_user     140381  non-null values
geo           5493  non-null values
dtypes: float64(1), object(4)

我可以根据不需要的关键字创建数据框:

junk = df[df.text.str.contains("Swans")]

但使用它来查看剩下的内容的最佳方式是什么?

2 个答案:

答案 0 :(得分:6)

df[~df.text.str.contains("Swans")]

答案 1 :(得分:1)

您还可以使用以下两个选项:

选项1:

df[-df.text.str.contains("Swans")]

选项2:

import numpy as np 
df[np.invert(df.text.str.contains("Swans"))]