如何使用HtmlUnit下载网页的Html内容/来源

时间:2013-06-11 06:38:29

标签: htmlunit

使用HtmlUnit我想下载html页面的源代码。我成功地做到了(见下面的代码)。

htmlContents = HtmlPageFetcher.fetchPage(
    "https://dbs-careers.dbs.com.sg/psc/careers/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL");
System.out.println(htmlContents);

现在对于同一个网站我想下载下一页(第2页)但是我没有下一页的网址(或者我应该说下一页也使用与前一页相同的网址)可以这有什么身体帮助吗?如何下载第2,3,4页等内容?????

2 个答案:

答案 0 :(得分:1)

您必须使用AJAX来获取该页面。如果您知道它是什么,那么只需参考HtmlUnit文档并了解如何使用它。如果您不知道AJAX是什么(基于这个问题非常可能),那么我建议首先学习如何使用AJAX,然后按照HtmlUnit文档进行操作。

答案 1 :(得分:0)

可能重复 How do I click a javascript button with htmlunit?

正如Mosty所说,该页面使用AJAX在页面之间导航。因此,您需要触发javascript函数以获取下一页结果。

您可以使用Clyde Lobo

的答案
  

尝试将此addOn用于firefox,它会记录您的操作和   生成HTMLUnit代码。可能会有所帮助。   http://code.google.com/p/htmlunitscripter /