我有一个用例,我需要在网站上填写表单,但无法访问API。目前我们正在使用webdriver和浏览器,但它变得非常繁重而且不是万无一失的,因为该过程是异步的。有没有办法可以在没有浏览器的情况下完成它,并通过密切监视待处理的请求来使进程同步?
Casperjs和htmlunitdriver似乎是我拥有的最佳选择。有人可以解释维护,防故障,重量轻的优点或缺点。
我需要浏览复杂和许多不同类型的网页。我想浏览的一些网页是由JS驱动的。
Scrapy可以用于此目的吗?
答案 0 :(得分:5)
使用 Htmlunitdriver 。为了使其失败证明您必须相应地进行一些更改。但它可以在没有浏览器的情况下工作。
答案 1 :(得分:2)
好吧,我一直在使用很多不同的方法来实现这一点,可靠的是你想要系统的智能/高级程度。我穿红宝石,红宝石很容易做到。下面是我发现最有用的方法(原因很漂亮的红宝石偏见):
换句话说,如果您不需要JS支持,请使用mechanize。