获取特定链接(不带<a>标记)

时间:2019-06-14 14:22:15

标签: regex

我正在努力检测字符串中的链接,并以浏览器可以理解的方式对其进行格式化。

这是我的字符串:

https://www.google.com <a href="https://www.youtube.ca" target="_blank">RBC Connect</a>

从上面的字符串中,我只想获取https://www.google.com,而不是<a href="https://www.youtube.ca" target="_blank">RBC Connect</a>标签

1 个答案:

答案 0 :(得分:1)

此表达式以两个"为界,将捕获我们想要的URL:

"(https?[^\s]+)"

使用以下捕获组:(https?[^\s]+)

Demo 1

如果我们不想捕获",则不捕获组可能会起作用:

(?:.+")(https?[^\s]+)(?:".+)
(?:")(https?[^\s]+)(?:")

Demo 2

或者先行积极,如果可以的话:

(?=.+")(https?[^\s]+)(?=".+)
(?=")(https?[^\s]+)(?=")

Demo 3