我需要从页面剪切所有css和js链接,现在我正在使用该正则表达式:
([^ ()]*\.(?:css|js)\b)
它的工作正常,但它也削减了一些链接,如:
href="stylesheets/{asfas}asf{,,.,sfasfas]F{asfas]fAS/MyFontsWebfontsKit.css
我需要添加到我的正则表达式以排除无效链接。我想我需要排除像'{}一样的字符。来自正则表达式匹配器?
我正在使用JAVA Pattern / Macther来编译我的正则表达式。
请不要建议我使用html解析器(比如Jsoup等)。
答案 0 :(得分:2)
尝试使用这样的正则表达式:
(?<==)([^ (){},]*?\.(?:css|js)\b)
或:
(?<=\s)([^ (){},]*?\.(?:css|js)\b)
如果你还想抓住href / src。