标签: regex
我正在努力检测字符串中的链接,并以浏览器可以理解的方式对其进行格式化。
这是我的字符串:
https://www.google.com <a href="https://www.youtube.ca" target="_blank">RBC Connect</a>
从上面的字符串中,我只想获取https://www.google.com,而不是<a href="https://www.youtube.ca" target="_blank">RBC Connect</a>标签
https://www.google.com
<a href="https://www.youtube.ca" target="_blank">RBC Connect</a>
答案 0 :(得分:1)
此表达式以两个"为界,将捕获我们想要的URL:
"
"(https?[^\s]+)"
使用以下捕获组:(https?[^\s]+)。
(https?[^\s]+)
如果我们不想捕获",则不捕获组可能会起作用:
(?:.+")(https?[^\s]+)(?:".+) (?:")(https?[^\s]+)(?:")
或者先行积极,如果可以的话:
(?=.+")(https?[^\s]+)(?=".+) (?=")(https?[^\s]+)(?=")