Question

使用HtmlUnit我想下载html页面的源代码。我成功地做到了（见下面的代码）。

htmlContents = HtmlPageFetcher.fetchPage(
    "https://dbs-careers.dbs.com.sg/psc/careers/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL");
System.out.println(htmlContents);

现在对于同一个网站我想下载下一页（第2页）但是我没有下一页的网址（或者我应该说下一页也使用与前一页相同的网址）可以这有什么身体帮助吗？如何下载第2,3,4页等内容?????

Answer 1

您必须使用AJAX来获取该页面。如果您知道它是什么，那么只需参考HtmlUnit文档并了解如何使用它。如果您不知道AJAX是什么（基于这个问题非常可能），那么我建议首先学习如何使用AJAX，然后按照HtmlUnit文档进行操作。

Answer 2

可能重复 How do I click a javascript button with htmlunit?

正如Mosty所说，该页面使用AJAX在页面之间导航。因此，您需要触发javascript函数以获取下一页结果。

您可以使用Clyde Lobo

的答案

尝试将此addOn用于firefox，它会记录您的操作和生成HTMLUnit代码。可能会有所帮助。 http://code.google.com/p/htmlunitscripter /

如何使用HtmlUnit下载网页的Html内容/来源

2 个答案: