使用HtmlUnit监控聊天室是否可行?

时间:2016-07-12 15:12:38

标签: java ajax web-scraping chat htmlunit

我最近开始使用HtmlUnit,有些成功抓取一些页面并与之交互,这是非常强大的工具......

但是,据我所知,我只是检索了一个具有某种状态的页面...我的下一步是让HtmlUnit从聊天室中不断地阅读消息,然后存储/执行某个字符串/正则表达式匹配的东西。我甚至在考虑与聊天室进行互动。

我不确定HtmlUnit是否走得那么远,我做了一些研究并找到了关于webDriverwebWindow等的内容,也许我需要与Threads合作才能做到这一点。 ...

你们能指出我正确的方向吗?

非常感谢

1 个答案:

答案 0 :(得分:0)

HtmlUnit尝试尽可能模拟真实的浏览器行为。

如果目标网站很简单,那么HtmlUnit就可以了。但在某些情况下,网站对于当前的HtmlUnit来说过于复杂,您需要将root cause隔离开来进行修复。

您可以从WebDriver开始,然后您可以轻松地从只需更改一行即可ChromeDriver / FirefoxDriverHtmlUnitDriver