我正在尝试使用正则表达式在字符串中查找英国邮政编码。
我在RegexBuddy中有正则表达式,见下文:
\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b
我有一堆地址,想要从中获取邮政编码,例如:
123一些道路名称镇,市城县为PA23 6NH
我将如何在Python中解决这个问题?我知道Python的re
模块,但我很难让它发挥作用。
干杯
EEF
答案 0 :(得分:6)
使用邮政编码PA23 6NH,PA2 6NH和PA2Q 6NH重复您的地址3次作为您的模式测试并使用维基百科对您的正则表达式,代码为..
import re
s="123 Some Road Name\nTown, City\nCounty\nPA23 6NH\n123 Some Road Name\nTown, City"\
"County\nPA2 6NH\n123 Some Road Name\nTown, City\nCounty\nPA2Q 6NH"
#custom
print re.findall(r'\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b', s)
#regex from #http://en.wikipedia.orgwikiUK_postcodes#Validation
print re.findall(r'[A-Z]{1,2}[0-9R][0-9A-Z]? [0-9][A-Z]{2}', s)
结果是
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH']
正则表达式都给出了相同的结果。
答案 1 :(得分:0)
尝试
import re
re.findall("[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}", x)
你不需要\ b。
答案 2 :(得分:0)
#!/usr/bin/env python
import re
ADDRESS="""123 Some Road Name
Town, City
County
PA23 6NH"""
reobj = re.compile(r'(\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b)')
matchobj = reobj.search(ADDRESS)
if matchobj:
print matchobj.group(1)
示例输出:
[user@host]$ python uk_postcode.py
PA23 6NH