列大熊猫

时间:2016-08-24 14:00:46

标签: python regex pandas dataframe series

我的问题是我如何使用re替换数据框中包含的字符串:

当我使用re.sub()时,它会给我一个错误:

p = re.compile('New')
p.sub('old', df['Col1'])

另外,我尝试使用for循环,但输出是意外的,并在所有其他行中显示第一行的值:

for i in df['Col1']:
    p.sub('old', i)
    print(i)

我确信我错过了什么。

1 个答案:

答案 0 :(得分:2)

我认为您可以使用str.replace,它也适用于regex

df = pd.DataFrame({'Col1':['sss old','dd','old']})
print (df)
      Col1
0  sss old
1       dd
2      old

df.Col1 = df.Col1.str.replace('old','new')
print (df)
      Col1
0  sss new
1       dd
2      new