我最近开始使用HtmlUnit
,有些成功抓取一些页面并与之交互,这是非常强大的工具......
但是,据我所知,我只是检索了一个具有某种状态的页面...我的下一步是让HtmlUnit
从聊天室中不断地阅读消息,然后存储/执行某个字符串/正则表达式匹配的东西。我甚至在考虑与聊天室进行互动。
我不确定HtmlUnit是否走得那么远,我做了一些研究并找到了关于webDriver
,webWindow
等的内容,也许我需要与Threads合作才能做到这一点。 ...
你们能指出我正确的方向吗?
非常感谢
答案 0 :(得分:0)
HtmlUnit尝试尽可能模拟真实的浏览器行为。
如果目标网站很简单,那么HtmlUnit就可以了。但在某些情况下,网站对于当前的HtmlUnit来说过于复杂,您需要将root cause隔离开来进行修复。
您可以从WebDriver
开始,然后您可以轻松地从只需更改一行即可ChromeDriver
/ FirefoxDriver
到HtmlUnitDriver
。