获取Java Class中的网页

时间:2010-12-27 19:40:46

标签: java xml client htmlunit

我目前使用htmlunit库来获取一个包含所有javascript和jsp的网页。 htmlunit似乎不是很强大 - 存在哪些替代方案?

3 个答案:

答案 0 :(得分:3)

如果你有时间学习它,HtmlUnit非常强大。如果学习HtmlUnit所需的时间是你的障碍(因为它是我的),JWebUnit对你来说可能是一个不错的选择。它基于HtmlUnit,但它更容易使用和学习。我使用它已经有一年了,但这正是我还是Java新手时所需要的。

答案 1 :(得分:0)

我使用过Apache HTTP客户端并很高兴。

Here是一个链接。

答案 2 :(得分:0)

HTMLUnit是人们称之为“无头浏览器”的唯一选择,而且正如我所知,这是您需要的功能。只是你知道(根据我的经验):有时来自htmlunit,浏览器有点不同;但这取决于你需要什么(或你如何使用该结果)。我几乎没有错误的动态元素位置,有两种选择:

  1. 我可以更改javascript,为所有主流浏览器和htmlunit
  2. 获得相同的结果
  3. 我不得不添加一些css样式和javascript代码,这不会影响我在浏览器中获得的页面视图,但有助于htmlunit以正确的方式修复布局。
  4. 实际上它是非常合乎逻辑的 - 没有浏览器使用htmlunit作为渲染引擎:)这是迄今为止该库唯一的问题。