在python中使用正则表达式提取数据

时间:2017-07-31 20:38:27

标签: python regex web-scraping

我在python中进行Web报废。我有以下数据,我只需要提取地址。

# AMEEn # MT****29 Clinics:MYData Clinic 12345-123 rue bridge, QC B3D 1G3Phone: (123)123-1234 Email: sodth@gmail.com MYData Clinic 12345-123 rue bridge, QC B3D 1G3Phone: (123)123-1234

我的逻辑是:

def getAddress(ent):
    addressEntry = re.search('(?<=Clinics:)(.*?)(?=Phone: )', ent)
    if addressEntry is None:
        return None
    return addressEntry.group(1)

1 个答案:

答案 0 :(得分:1)

似乎你拼错了Clinics错了(你错过了第二个 你的正则表达式中的“我”。

试试这个正则表达式:

'(?<=Clinics:)(.*?)(?=Phone: )'

Test it here!