Python,正则表达式邮政编码搜索

时间:2008-12-18 15:19:34

标签: python regex postal-code

我正在尝试使用正则表达式在字符串中查找英国邮政编码。

我在RegexBuddy中有正则表达式,见下文:

\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b

我有一堆地址,想要从中获取邮政编码,例如:

  

123一些道路名称镇,市城县为PA23 6NH

我将如何在Python中解决这个问题?我知道Python的re模块,但我很难让它发挥作用。

干杯

EEF

3 个答案:

答案 0 :(得分:6)

使用邮政编码PA23 6NH,PA2 6NH和PA2Q 6NH重复您的地址3次作为您的模式测试并使用维基百科对您的正则表达式,代码为..

import re

s="123 Some Road Name\nTown, City\nCounty\nPA23 6NH\n123 Some Road Name\nTown, City"\
    "County\nPA2 6NH\n123 Some Road Name\nTown, City\nCounty\nPA2Q 6NH"

#custom                                                                                                                                               
print re.findall(r'\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b', s)

#regex from #http://en.wikipedia.orgwikiUK_postcodes#Validation                                                                                            
print re.findall(r'[A-Z]{1,2}[0-9R][0-9A-Z]? [0-9][A-Z]{2}', s)

结果是

['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']

正则表达式都给出了相同的结果。

答案 1 :(得分:0)

尝试

import re
re.findall("[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}", x)

你不需要\ b。

答案 2 :(得分:0)

#!/usr/bin/env python

import re

ADDRESS="""123 Some Road Name
Town, City
County
PA23 6NH"""

reobj = re.compile(r'(\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b)')
matchobj = reobj.search(ADDRESS)
if matchobj:
    print matchobj.group(1)

示例输出:

[user@host]$ python uk_postcode.py 
PA23 6NH