我的数据框中有一个列,如下所示:
range
(2,30)
(50,290)
(400,1000)
...
我想替换','逗号与' - '短跑。我目前正在使用此方法,但没有任何改变。
org_info_exc['range'].replace(',','-',inplace=True)
有人可以帮忙吗?
答案 0 :(得分:101)
In [30]:
df['range'] = df['range'].str.replace(',','-')
df
Out[30]:
range
0 (2-30)
1 (50-290)
修改强>
因此,如果我们看看你尝试了什么以及为什么它不起作用:
df['range'].replace(',','-',inplace=True)
来自docs我们看到这个desc:
str或regex:str:完全匹配to_replace的字符串将被替换 有价值的
因为str值不匹配,所以不会发生替换,请与以下内容进行比较:
In [43]:
df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)
df['range']
Out[43]:
0 (2,30)
1 -
Name: range, dtype: object
这里我们得到第二行的完全匹配,并且发生了替换。
答案 1 :(得分:7)
对于其他任何从Google搜索到的人,如何在 all 列上进行字符串替换(例如,如果其中有多个列,例如OP的“范围”列):
Pandas在数据框对象上具有内置的replace
方法。
df.replace(',', '-', regex=True)
来源:Docs
答案 2 :(得分:2)
此外,对于那些希望替换一列中多个字符的用户,可以使用正则表达式来实现:
import re
chars_to_remove = ['.', '-', '(', ')', '']
regular_expression = '[' + re.escape (''. join (chars_to_remove)) + ']'
df['string_col'].str.replace(regular_expression, '', regex=True)
答案 3 :(得分:1)
如果您只需要替换一个特定列中的字符,则regex = True和place = True都失败了,我认为这种方式会起作用:
data["column_name"] = data["column_name"].apply(lambda x: x.replace("characters_need_to_replace", "new_characters"))
lambda更像是在这种情况下像for循环一样工作的函数。 x代表当前列中的每个条目。
您唯一需要做的就是更改“ column_name”,“ characters_need_to_replace”和“ new_characters”。
答案 4 :(得分:0)
在列名称中用下划线替换所有逗号
data.columns= data.columns.str.replace(' ','_',regex=True)
答案 5 :(得分:0)
注意:
如果要从字符串中删除两个或多个元素,例如:
Column_Name
===========
$100,000
$1,100,000
使用:
data.Column_Name.str.replace("[$,]", "", regex=True)
=> [ 100000, 1100000 ]