Python Pandas:如何替换数据框列中的字符?

时间:2015-03-11 12:19:59

标签: python replace pandas dataframe

我的数据框中有一个列,如下所示:

range
(2,30)
(50,290)
(400,1000)
... 

我想替换','逗号与' - '短跑。我目前正在使用此方法,但没有任何改变。

org_info_exc['range'].replace(',','-',inplace=True)

有人可以帮忙吗?

6 个答案:

答案 0 :(得分:101)

使用向量化str方法replace

In [30]:

df['range'] = df['range'].str.replace(',','-')
df
Out[30]:
      range
0    (2-30)
1  (50-290)

修改

因此,如果我们看看你尝试了什么以及为什么它不起作用:

df['range'].replace(',','-',inplace=True)

来自docs我们看到这个desc:

  

str或regex:str:完全匹配to_replace的字符串将被替换   有价值的

因为str值不匹配,所以不会发生替换,请与以下内容进行比较:

In [43]:

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)
df['range']
Out[43]:
0    (2,30)
1         -
Name: range, dtype: object

这里我们得到第二行的完全匹配,并且发生了替换。

答案 1 :(得分:7)

对于其他任何从Google搜索到的人,如何在 all 列上进行字符串替换(例如,如果其中有多个列,例如OP的“范围”列): Pandas在数据框对象上具有内置的replace方法。

df.replace(',', '-', regex=True)

来源:Docs

答案 2 :(得分:2)

此外,对于那些希望替换一列中多个字符的用户,可以使用正则表达式来实现:

import re
chars_to_remove = ['.', '-', '(', ')', '']
regular_expression = '[' + re.escape (''. join (chars_to_remove)) + ']'

df['string_col'].str.replace(regular_expression, '', regex=True)

答案 3 :(得分:1)

如果您只需要替换一个特定列中的字符,则regex = True和place = True都失败了,我认为这种方式会起作用:

data["column_name"] = data["column_name"].apply(lambda x: x.replace("characters_need_to_replace", "new_characters"))

lambda更像是在这种情况下像for循环一样工作的函数。 x代表当前列中的每个条目。

您唯一需要做的就是更改“ column_name”,“ characters_need_to_replace”和“ new_characters”。

答案 4 :(得分:0)

在列名称中用下划线替换所有逗号

data.columns= data.columns.str.replace(' ','_',regex=True)

答案 5 :(得分:0)

注意:

如果要从字符串中删除两个或多个元素,例如:

Column_Name
===========
$100,000
$1,100,000

使用:

data.Column_Name.str.replace("[$,]", "", regex=True)

=> [ 100000, 1100000 ]