我想编写支持cookie存储操作和会话的crawler。 java无头浏览器有两种不同的实现方式。 HtmlUnit更好地支持javascript和html解析。但是有没有理由使用HttpUnit来实现爬虫的性能?
答案 0 :(得分:0)
来自其中一位HtmlUnit开发人员的相关文章here。
它基本上说,除了Javascript支持,HtmlUnit更高级别的HttpUnit。 HtmlUnit似乎也更积极地开发(2014年发布了2个版本,而自2008年以来HttpUnit尚未更新)。