需要在Python中基于正则表达式提取子字符串

时间:2013-01-04 17:54:38

标签: python regex substring

我需要提取在使用Python

的任何可能的PO BOX组合之后出现的子字符串

例如

P.O Box 88743

邮政信箱04049

PO BOX 304040

P.O。方框49293

邮政信箱2039a

结果:我应该能够提取以下子句

88743

4049(领先0被删除)

304040

49293

2039a

子字符串可以是字母数字,包含1-10个数字

请帮助!!

1 个答案:

答案 0 :(得分:7)

以下应该这样做:

re.findall(r'P[.]?O[.]?\s*box\s+0*([0-9a-zA-Z]+)', s, re.I)

其中s是您的字符串。