Question

我正在通过使用Jsoup库来选择网页，方法是选择其中包含“ nav”字符串的类属性。

这是获取网站HTML的代码：

var bodyString = Jsoup.connect(url)
                .ignoreContentType(true)
                .userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0")
                .timeout(12000)
                .followRedirects(true)
                .execute()
                .body();

由Jsoup CSS选择器选择的HTML示例：

但在浏览器中，同一网站HTML看起来像这样：

如您所见，id为=“ varPreviewMenu”的ul元素包含由Jsoup检索的HTML不包含的li元素。

如何获取这些元素？

Answer 1

您看到的元素很可能是通过某些JavaScript代码动态添加到DOM的。这意味着当您使用Jsoup时，它们在请求的正文中不可用。

使用Jsoup获取完整的HTML

1 个答案: