Question

首次发帖，请耐心等待。

我在匹配字符串然后替换它们时遇到了一些麻烦。这是我的系列的样子：

                          place_of_death
1                           Baghdad 
2                            Kirkuk
3                            Tallil
4                             Babil
5                            Kirkuk
6                          Baghdad 
...                         ...
26      Baghdad (southeastern part)

我有很多像＃26这样的条目，带有无关的信息。我所要做的就是修剪弦乐的末尾部分，以便在系列中拥有“巴格达”部分。这是我尝试过的，它没有抛出错误但也没有做我希望做的事情：

df['place_of_death'].replace(to_replace= 'r(^Baghdad+)', value='Baghdad',regex=True)

感谢任何帮助。我对正则表达式不太熟悉，所以我希望了解更多。

Answer 1

您可以使用以下正则表达式替换每个字符串末尾出现的(extra info)。

正则表达式： $.*?$$替换为empty string -> ""

<强>解释

$.*?$$查找每个字符串的 end 括号中的字符串。

要使用的标记：

g进行全球搜索。
m用于多行搜索。

<强> Regex101 Demo

python正则表达式：替换熊猫系列中的字符串

1 个答案: