python正则表达式:替换熊猫系列中的字符串

时间:2016-04-02 18:11:55

标签: python regex pandas

首次发帖,请耐心等待。

我在匹配字符串然后替换它们时遇到了一些麻烦。这是我的系列的样子:

                          place_of_death
1                           Baghdad 
2                            Kirkuk
3                            Tallil
4                             Babil
5                            Kirkuk
6                          Baghdad 
...                         ...
26      Baghdad (southeastern part)

我有很多像#26这样的条目,带有无关的信息。我所要做的就是修剪弦乐的末尾部分,以便在系列中拥有“巴格达”部分。这是我尝试过的,它没有抛出错误但也没有做我希望做的事情:

df['place_of_death'].replace(to_replace= 'r(^Baghdad+)', value='Baghdad',regex=True)

感谢任何帮助。我对正则表达式不太熟悉,所以我希望了解更多。

1 个答案:

答案 0 :(得分:0)

您可以使用以下正则表达式替换每个字符串末尾出现的(extra info)

正则表达式: \(.*?\)$替换为empty string -> ""

<强>解释

  • \(.*?\)$查找每个字符串的 end 括号中的字符串。

要使用的标记:

  • g进行全球搜索。

  • m用于多行搜索。

<强> Regex101 Demo