这可能是一个微不足道的查询,但我无法解决。
基本上,我希望能够从下面的数据框中过滤出嘈杂的推文
<class 'pandas.core.frame.DataFrame'>
Int64Index: 140381 entries, 0 to 140380
Data columns:
text 140381 non-null values
created_at 140381 non-null values
id 140381 non-null values
from_user 140381 non-null values
geo 5493 non-null values
dtypes: float64(1), object(4)
我可以根据不需要的关键字创建数据框:
junk = df[df.text.str.contains("Swans")]
但使用它来查看剩下的内容的最佳方式是什么?
答案 0 :(得分:6)
df[~df.text.str.contains("Swans")]
答案 1 :(得分:1)
您还可以使用以下两个选项:
df[-df.text.str.contains("Swans")]
import numpy as np
df[np.invert(df.text.str.contains("Swans"))]