匹配文本中的网址(现有<a href="" ...=""> links</a>除外)

时间:2015-03-17 08:42:44

标签: regex

我有以下正则表达式:

var URLREGETX1 = /(\b(https?|ftp):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/gim;

捕获协议和网址。它运作良好,但我想确保它不会捕捉到foo链接。

我试图摆弄(?!href=\")但没有取得多大成功。

https://regex101.com/r/fE7pY9/1

1 个答案:

答案 0 :(得分:0)

我使用negative Look Behind完成了这项工作。

(?<!RegExpThatShouldNotBeAPrefix)RegExpToMatch

根据regex101,Javascript不支持此功能。但你应该在现场测试这个。

我通过切换到python使其工作。

https://regex101.com/r/tU1fS3/1