标签: regex url
我想匹配一个尚未包含在href中的任何URL。即我想忽略以下内容。
<a href="http://www.test.com/whatever">
我正在尝试编写一个正则表达式来自动查找网址,以便我可以将它们变成标记为hrefs。
我遇到的问题是处理已经标记的网址(文档包含标记的和未标记的网址)。
答案 0 :(得分:0)
使用负向前看以查看网址前面是否没有</a>
</a>
your_regex(?!\s*</a>)