Python:基于多个正则表达式规则从字符串部分中提取

时间:2019-07-04 21:33:05

标签: python regex string

我有一个熊猫数据框,其中的特定列包含用逗号分隔的长字符串。

我希望该列上的每个条目根据以下规则之一提取字符串的特定部分。每次只有一条规则有效

规则是:

-单词以strasse结尾。然后导出整个单词,直到逗号为止。

-单词以大写字母A开头,返回整个单词,直到逗号为止。

例如字符串 “ A12,Thörishaus,Köniz,Verwaltungskreis”

返回A12(最后一条规则)

例如字符串 “ Stapfenstrasse,科尼兹,韦尔瓦东斯克雷伊斯”

返回Stapfenstrasse(第一条规则)。

我该怎么做?

因此,对于数据框列中的每个条目,请检查是否有规则之一适用,然后导出所需的字符串。

可以请教吗?

谢谢 亚历克斯

0 个答案:

没有答案