Question

我正在使用Jsoup仅使用第一页链接从在线漫画网站中获取特定漫画章节的所有图像。

我已成功检索到第一页的总页码和src，例如：如果提供此链接“http://www.mangapanda.com/feng-shen-ji/1/1”，则输出将为：

总页数：49

标题：冯申基1

ImageURL：http://i15.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974919.jpg

我现在要做的是获取第二页的src，然后自动增加以获得其余部分。第二页的链接在html中：

<div id="prefetchimg" style="background-image: url("http://i34.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974921.jpg");"></div>

但是当我使用jsoup作为

时

String url = "http://www.mangapanda.com/feng-shen-ji/1";
Document doc = Jsoup.connect(url).userAgent("Mozilla").get();
Elements div = doc.select("div");
for (Element divParse : div) {
if(divParse.id().equals("prefetchimg"))
System.out.println(divParse);}

我只得到

<div id="prefetchimg"></div>

而不是

<div id="prefetchimg" style="background-image: url("http://i34.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974921.jpg");"></div>

如何获取样式属性？ enter image description here

Answer 1

@eltabo说

好的，在您的情况下，您的标记已被javascript函数修改，因此Jsoup无法看到此属性

这是事实，JSoup仅适用于Html页面。对于使用JS的Html，例如HtmlUnit

使用jsoup不显示样式属性

1 个答案: