Question

我正在尝试在html中查找网址。这是我想要匹配的例子：

HREF = “HTTP：//（+）”（？：+）

<a href="http://www.etf.rs/" target="_top">

匹配： www.etf.rs/“target =

它应该： www.etf.rs **

如果它匹配一些rubish的东西并不重要，但它的重要性是所有URL都匹配。谢谢！

Answer 1

您可以使用re.search：

import re

s = '<a href="http://www.etf.rs/" target="_top">'
print re.search('"http://(.*)"\s', s).group(1)

输出：

www.etf.rs/