Pandas(Python模块) - 在特定列中搜索字符串

时间:2017-02-14 21:58:48

标签: python pandas

很抱歉,如果这是一个基本问题,我今天就开始使用pandas模块了。但基本上我用它来清理我正在使用的这个csv文件。我试图在第二列中搜索特定的字符串(或子字符串),如果我找到它,我想在数据集中添加一个新列,该列将包含布尔值true / false(如果我找到给定的字符串或不。)建议?

1 个答案:

答案 0 :(得分:0)

您可以使用Series.str.contains()方法:

df['new'] = df.iloc[:, 1].str.contains(r'substring', flags=re.I)

演示:

In [40]: import re

In [41]: df
Out[41]:
   a       b   c
0  1    Anna  10
1  2  Barton  11
2  3     Max  12

In [42]: df['new'] = df.iloc[:, 1].str.contains(r'ma', flags=re.I)

In [43]: df
Out[43]:
   a       b   c    new
0  1    Anna  10  False
1  2  Barton  11  False
2  3     Max  12   True