很抱歉,如果这是一个基本问题,我今天就开始使用pandas模块了。但基本上我用它来清理我正在使用的这个csv文件。我试图在第二列中搜索特定的字符串(或子字符串),如果我找到它,我想在数据集中添加一个新列,该列将包含布尔值true / false(如果我找到给定的字符串或不。)建议?
答案 0 :(得分:0)
您可以使用Series.str.contains()方法:
df['new'] = df.iloc[:, 1].str.contains(r'substring', flags=re.I)
演示:
In [40]: import re
In [41]: df
Out[41]:
a b c
0 1 Anna 10
1 2 Barton 11
2 3 Max 12
In [42]: df['new'] = df.iloc[:, 1].str.contains(r'ma', flags=re.I)
In [43]: df
Out[43]:
a b c new
0 1 Anna 10 False
1 2 Barton 11 False
2 3 Max 12 True