我正在使用Selenium和PhantomJS滚动到Twitter搜索结果无限滚动页面的底部。
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
我手动设置了多次循环(我尝试估计网页驱动程序在崩溃之前可以重新加载多少次)。完成后,我抓住原始的html:
text_file.write(driver.page_source.encode("utf-8"))
这项工作正常,但我正在寻找一种方法来保持程序在没有“浏览器缓存”的情况下运行,或者填写任何内容。关于如何实现以下步骤的任何想法?
运行driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
命令X次
然后将加载的原始html转储到文本文件
然后再次运行X次驱动程序
然后将加载的原始html转储到另一个文本文件中,但不转储步骤1中加载的内容,只转储步骤3中加载的新内容
这会将浏览器/驱动程序内存清空为几个输出文本文件,并使循环实际上可以永久存在。有什么想法吗?