正则表达式从html切割css和js链接

时间:2015-08-05 12:54:22

标签: java regex

我需要从页面剪切所有css和js链接,现在我正在使用该正则表达式:

([^ ()]*\.(?:css|js)\b)

它的工作正常,但它也削减了一些链接,如:

href="stylesheets/{asfas}asf{,,.,sfasfas]F{asfas]fAS/MyFontsWebfontsKit.css

我需要添加到我的正则表达式以排除无效链接。我想我需要排除像'{}一样的字符。来自正则表达式匹配器?

我正在使用JAVA Pattern / Macther来编译我的正则表达式。

请不要建议我使用html解析器(比如Jsoup等)。

UPDATE1 enter image description here

1 个答案:

答案 0 :(得分:2)

尝试使用这样的正则表达式:

(?<==)([^ (){},]*?\.(?:css|js)\b)

DEMO

或:

(?<=\s)([^ (){},]*?\.(?:css|js)\b)

如果你还想抓住href / src。