python pandas.Series.str.contains包含空格的单词

时间:2016-09-12 21:47:21

标签: python regex pandas dataframe

我试图找到包含"互联网","节目"," socket编程"在熊猫数据框中。

df.col_name.str.contains(" internet | program | socket programming ", case=False)

这是正确的方法吗?或者我是否需要使用\和原始字符串来逃避空间?

1 个答案:

答案 0 :(得分:5)

这是一个小型演示:

In [250]: df
Out[250]:
                                      txt
0                                Internet
1  There is no Internet in this apartment
2                                Program2
3    I am learning socket programming too

In [251]: df.txt.str.contains(" internet | program | socket programming ", case=False)
Out[251]:
0    False
1     True
2    False
3     True
Name: txt, dtype: bool

如果你想"匹配"也是第一行:Internet

In [252]: df.txt.str.contains(r"\b(?:internet|program|socket\s+programming)\b", case=False)
Out[252]:
0     True
1     True
2    False
3     True
Name: txt, dtype: bool