我正在使用phantomjs --webdriver 8910
在Remote WebDriver模式下运行phantomjs,然后使用Selenium python绑定获取许多页面,例如:
wd = webdriver.PhantomJS(port=8910)
for url in big_url_list:
wd.get(url)
# do something here, e.g. wd.save_screenshot or print wd.page_source
wd.quit()
wd.quit()
似乎无能为力。使用top监视进程表明,当检索到更多页面时,phantomjs进程的内存使用量会继续增加。如果我重新启动phantomjs进程,那么内存使用率会下降并开始再次稳定攀升。
close method mentioned in the phantomjs docs听起来很有希望,但我认为没有办法通过WebDriver protocol来调用它。
是否有(i)在发出许多请求时保持phantomjs的内存使用率下降的方法,或者(ii)监视和定期重启phantomjs进程的可靠方法,以便内存永远不会失控?
答案 0 :(得分:1)
This SO question建议使用已被弃用的release,以支持close。好像是python webdriver API exposes the close method?
答案 1 :(得分:1)
只有在关闭WebDriver会话时,才能通过Ghostdriver调用PhantomJS网页关闭方法。 当达到内存限制时,您可以尝试使用runit重新启动PhantomJS。按如下方式创建bash脚本:
#!/bin/sh
exec 2>&1
exec chpst -u your_user -m 104857600 /usr/bin/phantomjs --webdriver=8910
-m标志将内存限制设置为100MB。
将上面的脚本放在一个名为“run”的空目录下:
|
`-phantomjs-runit-+
`-run
现在你可以开始使用phantomjs
了sv start ./phantomjs-runit/