RegEx用于除图像,脚本等之外的链接

时间:2014-01-20 10:55:53

标签: html regex

我写了一个正则表达式,找到了文本中的所有链接。

(?s)(?m)(?i).*(http://[0-9a-z.%/_-]+).?".*

如何除了对图像,脚本等的引用?

1 个答案:

答案 0 :(得分:2)

这个很乱,但是完成了工作:

(?!https?:\/\/[\w%\/_.-]+\.(jpg|js|gif))(https?:\/\/[\w%\/_.-]+\.\w+)

排除不需要的链接,然后是“所有链接”捕获,这是一个消极的展望。也许不是最优雅的解决方案,但它确实有效。

也允许https。将不需要的链接类型添加到(jpg | js | gif)列表中(由竖线分隔)。

我不确定java,但它适用于regex101提供的各种口味。使用全球旗帜。