如何使用正则表达式提取所有链接?
链接示例:
<a class="link" title="somehing" href="https://www.website.com/link" data-jsid="anchor" target="_blank"> (more html stuff..)
I want to this: https://www.website.com/link
我尝试这样的事情,但还不够具体。
href=""(.*?)"".*?>(.*?)
答案 0 :(得分:1)
您可以使用类似
的内容href="([^"]+)"
[^"]+
匹配"
示例:http://regex101.com/r/lA8nD8/1
此处捕获groupo 1将包含字符串
https://www.website.com/link
或强>
你也可以使用非贪婪的.+?
作为
href=".+?"
示例:http://regex101.com/r/lA8nD8/2
或强>
你可以试试看后卫
(?<=href=")([^"]+)