使用HtmlUnit我想下载html页面的源代码。我成功地做到了(见下面的代码)。
htmlContents = HtmlPageFetcher.fetchPage(
"https://dbs-careers.dbs.com.sg/psc/careers/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL");
System.out.println(htmlContents);
现在对于同一个网站我想下载下一页(第2页)但是我没有下一页的网址(或者我应该说下一页也使用与前一页相同的网址)可以这有什么身体帮助吗?如何下载第2,3,4页等内容?????
答案 0 :(得分:1)
您必须使用AJAX来获取该页面。如果您知道它是什么,那么只需参考HtmlUnit文档并了解如何使用它。如果您不知道AJAX是什么(基于这个问题非常可能),那么我建议首先学习如何使用AJAX,然后按照HtmlUnit文档进行操作。
答案 1 :(得分:0)
可能重复 How do I click a javascript button with htmlunit?
正如Mosty所说,该页面使用AJAX在页面之间导航。因此,您需要触发javascript函数以获取下一页结果。
您可以使用Clyde Lobo
的答案尝试将此addOn用于firefox,它会记录您的操作和 生成HTMLUnit代码。可能会有所帮助。 http://code.google.com/p/htmlunitscripter /