首次发帖,请耐心等待。
我在匹配字符串然后替换它们时遇到了一些麻烦。这是我的系列的样子:
place_of_death
1 Baghdad
2 Kirkuk
3 Tallil
4 Babil
5 Kirkuk
6 Baghdad
... ...
26 Baghdad (southeastern part)
我有很多像#26这样的条目,带有无关的信息。我所要做的就是修剪弦乐的末尾部分,以便在系列中拥有“巴格达”部分。这是我尝试过的,它没有抛出错误但也没有做我希望做的事情:
df['place_of_death'].replace(to_replace= 'r(^Baghdad+)', value='Baghdad',regex=True)
感谢任何帮助。我对正则表达式不太熟悉,所以我希望了解更多。
答案 0 :(得分:0)
您可以使用以下正则表达式替换每个字符串末尾出现的(extra info)
。
正则表达式: \(.*?\)$
替换为empty string -> ""
<强>解释强>
\(.*?\)$
查找每个字符串的 end 括号中的字符串。要使用的标记:
g
进行全球搜索。
m
用于多行搜索。
<强> Regex101 Demo 强>