用于抓取由' next'分隔的多个页面的一般方法链接

时间:2014-10-14 11:28:02

标签: web-scraping greasemonkey tampermonkey

使用像Greasemonkey或Tampermonkey这样的浏览器内脚本扩展程序,在多页面上抓取信息时常用的一般方法是什么,其中页面使用' next'进行导航。链接,重新加载顶级文档?

我过去写过这样的东西,我想要抓的信息是在一个框架中,然后是'下一个'链接重新加载框架,这很好,很容易。但我现在有一个实例,其中' next'链接重新加载整个页面,这当然会导致用户脚本重新加载,忘记它在哪里:)

我想我可以通过将内容加载到我插入页面的框架中(然后在该框架内生成点击)来实现这一点,但是如果有更优雅的解决方案我会喜欢听到它!

0 个答案:

没有答案