这在Jsoup中可能相当容易,但我在jsoup cookbook中找不到任何相关信息,所以我在这里问。
<div class="team" style="float: right; background: url('http://teampage.com')"></div>
如何使用Jsoup获取网址内容?
答案 0 :(得分:1)
尝试这样的事情:
(从one of my projects拉出来,所以你必须适应它)
public void getURLsFromCSS(String cssToParse) {
//cssToParse -- The css string to get URL's from
String patternString = "url(\\s*\\(\\s*['\"]*\\s*)(.*?)\\s*['\"]*\\s*\\)"; //I hate regexes...
Pattern pattern = Pattern.compile(patternString);
Matcher matcher = pattern.matcher(cssToParse);
//find everything inside url(" ... ")
while (matcher.find()) {
System.out.println("URL:" + matcher.group().replaceAll(patternString, "$2"));
}
}
您必须从jSoup获取style属性的内容,并将其提供给此方法。如果url相对于HTML文档,您可能需要将它们设置为绝对值,具体取决于您要执行的操作。