使用Jsoup获取完整的HTML

时间:2019-05-02 16:28:34

标签: java jsoup

我正在通过使用Jsoup库来选择网页,方法是选择其中包含“ nav”字符串的类属性。

这是获取网站HTML的代码:

var bodyString = Jsoup.connect(url)
                .ignoreContentType(true)
                .userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0")
                .timeout(12000)
                .followRedirects(true)
                .execute()
                .body();

由Jsoup CSS选择器选择的HTML示例: enter image description here

但在浏览器中,同一网站HTML看起来像这样: enter image description here

如您所见,id为=“ varPreviewMenu”的ul元素包含由Jsoup检索的HTML不包含的li元素。

如何获取这些元素?

1 个答案:

答案 0 :(得分:2)

您看到的元素很可能是通过某些JavaScript代码动态添加到DOM的。这意味着当您使用Jsoup时,它们在请求的正文中不可用。