正则表达式匹配尚未标记的链接

时间:2009-10-23 09:46:00

标签: regex url

我想匹配一个尚未包含在href中的任何URL。即我想忽略以下内容。

<a href="http://www.test.com/whatever">

我正在尝试编写一个正则表达式来自动查找网址,以便我可以将它们变成标记为hrefs。

我遇到的问题是处理已经标记的网址(文档包含标记的和未标记的网址)。

1 个答案:

答案 0 :(得分:0)

使用负向前看以查看网址前面是否没有</a>

your_regex(?!\s*</a>)