提取背景链接,jsoup

时间:2011-05-31 22:47:16

标签: java background-image jsoup

我使用jsoup从以下性质的HTML中提取链接时遇到问题。

<div class="post_video" style="background-image:url(http://img.youtube.com/vi/JFf3uazyXco/2.jpg);">

1 个答案:

答案 0 :(得分:5)

我就是这样做的。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


public class JSoup {
    public static void main(String[] args) {
        String html = "<html><head></head><body><div class=\"post_video\" style=\"background-image:url(http://img.youtube.com/vi/JFf3uazyXco/2.jpg);\"></body></html>";

        Document doc = Jsoup.parse( html );
        Elements elements = doc.getElementsByClass("post_video");

        for( Element e : elements ) {
            String attr = e.attr("style");
            System.out.println( attr.substring( attr.indexOf("http://"), attr.indexOf(")") ) );
        }
    }

}