我想捕获数据框中某列的“软件问题”。我的代码无法捕获在“软件问题”之间有多个空格的第四行。
data['comment'].str.contains("\\bsoftware issue\\b", case = False)
O/P:
Out[53]:
0 False
1 True
2 True
3 False
4 True
Name: comment, dtype: bool
**comment**
software
software issue
found software issue at end
SOFTWARE ISSUE
IN SOFTWARE ISSUE ON
请对此提出建议,以便我能够捕获甚至在它们之间有空格的单词。
答案 0 :(得分:1)
您可以使用\s+
来检测空格。
例如:
import pandas as pd
data = pd.DataFrame({"comment": ["software", "software issue", "found software issue at end", "SOFTWARE ISSUE" ]})
print(data['comment'].str.contains("\\bsoftware\s+issue\\b", case = False))
输出:
0 False
1 True
2 True
3 True
Name: comment, dtype: bool