使用正则表达式提取链接

时间:2014-11-29 17:17:45

标签: regex vb.net visual-studio-2010

如何使用正则表达式提取所有链接?

链接示例:

<a class="link" title="somehing" href="https://www.website.com/link" data-jsid="anchor" target="_blank"> (more html stuff..)

I want to this: https://www.website.com/link

我尝试这样的事情,但还不够具体。

  href=""(.*?)"".*?>(.*?)

1 个答案:

答案 0 :(得分:1)

您可以使用类似

的内容
href="([^"]+)"
  • [^"]+匹配"
  • 以外的任何内容

示例:http://regex101.com/r/lA8nD8/1

此处捕获groupo 1将包含字符串

https://www.website.com/link

你也可以使用非贪婪的.+?作为

href=".+?"

示例:http://regex101.com/r/lA8nD8/2

你可以试试看后卫

(?<=href=")([^"]+)

示例:http://regex101.com/r/lA8nD8/3