我写了一个正则表达式,找到了文本中的所有链接。
(?s)(?m)(?i).*(http://[0-9a-z.%/_-]+).?".*
如何除了对图像,脚本等的引用?
答案 0 :(得分:2)
这个很乱,但是完成了工作:
(?!https?:\/\/[\w%\/_.-]+\.(jpg|js|gif))(https?:\/\/[\w%\/_.-]+\.\w+)
排除不需要的链接,然后是“所有链接”捕获,这是一个消极的展望。也许不是最优雅的解决方案,但它确实有效。
也允许https。将不需要的链接类型添加到(jpg | js | gif)列表中(由竖线分隔)。
我不确定java,但它适用于regex101提供的各种口味。使用全球旗帜。