我的文字中的网址如下所示:
<https://buy.itunes.apple.com/WebObjects/MZFinance.woa/wa/reportAProblem?p
=22000073760328&o=i>
我使用以下模式尝试删除它们:
re.sub(r'\<http.+?\>', '', plain, re.S)
但它不会全部获得它们,例如,这个不会被删除:
<http://ax.phobos.apple.com.edgesuite.net/email/images_shared/spacer_99999\r\n9.gif>
答案 0 :(得分:7)
尝试这样
p=re.compile(r'\<http.+?\>', re.DOTALL)
re.sub(p, '', plain)