Python - 使用正则表达式从文本中删除URL

时间:2013-03-29 20:18:10

标签: python regex url

我的文字中的网址如下所示:

<https://buy.itunes.apple.com/WebObjects/MZFinance.woa/wa/reportAProblem?p
=22000073760328&o=i>

我使用以下模式尝试删除它们:

re.sub(r'\<http.+?\>', '', plain, re.S)

但它不会全部获得它们,例如,这个不会被删除:

<http://ax.phobos.apple.com.edgesuite.net/email/images_shared/spacer_99999\r\n9.gif>

1 个答案:

答案 0 :(得分:7)

尝试这样

p=re.compile(r'\<http.+?\>', re.DOTALL)
re.sub(p, '', plain)