使用jsoup不显示样式属性

时间:2014-01-27 10:04:44

标签: java html jsoup

我正在使用Jsoup仅使用第一页链接从在线漫画网站中获取特定漫画章节的所有图像。

我已成功检索到第一页的总页码和src,例如:如果提供此链接“http://www.mangapanda.com/feng-shen-ji/1/1”,则输出将为:

总页数:49

标题:冯申基1

ImageURL:http://i15.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974919.jpg

我现在要做的是获取第二页的src,然后自动增加以获得其余部分。第二页的链接在html中:

<div id="prefetchimg" style="background-image: url("http://i34.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974921.jpg");"></div>

但是当我使用jsoup作为

String url = "http://www.mangapanda.com/feng-shen-ji/1";
Document doc = Jsoup.connect(url).userAgent("Mozilla").get();
Elements div = doc.select("div");
for (Element divParse : div) {
if(divParse.id().equals("prefetchimg"))
System.out.println(divParse);}

我只得到

<div id="prefetchimg"></div>

而不是

<div id="prefetchimg" style="background-image: url("http://i34.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974921.jpg");"></div>

如何获取样式属性?     enter image description here

1 个答案:

答案 0 :(得分:0)

@eltabo

  

好的,在您的情况下,您的标记已被javascript函数修改,因此Jsoup无法看到此属性

这是事实,JSoup仅适用于Html页面。对于使用JS的Html,例如HtmlUnit