使用Groovy Geb库以批处理模式抓取网页

时间:2013-03-25 17:50:22

标签: groovy geb

我想抓一些网页给他们的网址。据称Geb库能够进行屏幕抓取。

到目前为止,我使用Browser.drive方法并在方法中指定一个页面URL。这样我就可以从该特定页面中抓取数据。但每次我必须手动将URL更改为另一个页面。当我再次运行脚本时,将打开一个新的浏览器,这需要很长时间。我不需要打开浏览器,只需要从页面中抓取数据。我相信我必须有一些机制让我在所有网页上以批处理模式进行数据抓取。我已多次阅读The Book Of Geb,但仍无法找到有关如何进行的讨论。

0 个答案:

没有答案