如何在Selenium + Python中拦截无头Chrome下载的网络资源?

时间:2018-08-30 16:39:56

标签: selenium-chromedriver google-chrome-headless

我要做的是使用Selenium + Python访问无头Chrome渲染页面时下载的(JSON)资源的内容。理想情况下,我可以获取URL列表,然后有选择地选择要获取其内容的URL。我还认为,也许我可以在无头Chrome中进行设置,以将其记录为页面渲染。

这可以通过saving a HAR file结果,然后在其中找到感兴趣的资源来完成,但这并不是一件容易的事,而且我还没有找到一种不involve a proxy的解决方案(我我已经在使用代理,因此我必须将它们链接起来才能正常工作。

有没有人建议如何在没有代理的情况下进行操作,而又不切换到支持HAR导出本机的东西(PhantomJS / Splash)?

0 个答案:

没有答案