Question

很抱歉，如果这是一个基本问题，我今天就开始使用pandas模块了。但基本上我用它来清理我正在使用的这个csv文件。我试图在第二列中搜索特定的字符串（或子字符串），如果我找到它，我想在数据集中添加一个新列，该列将包含布尔值true / false（如果我找到给定的字符串或不。）建议？

Answer 1

您可以使用Series.str.contains()方法：

df['new'] = df.iloc[:, 1].str.contains(r'substring', flags=re.I)

演示：

In [40]: import re

In [41]: df
Out[41]:
   a       b   c
0  1    Anna  10
1  2  Barton  11
2  3     Max  12

In [42]: df['new'] = df.iloc[:, 1].str.contains(r'ma', flags=re.I)

In [43]: df
Out[43]:
   a       b   c    new
0  1    Anna  10  False
1  2  Barton  11  False
2  3     Max  12   True

Pandas（Python模块） - 在特定列中搜索字符串

1 个答案: