Question

我有一个使用selenium的webdriver，它为我打开一个浏览器，将它指向一个ip地址，做了很多东西并关闭。

我想知道在此期间访问的所有网址。也就是说，任何已加载的广告，任何对任何网址发出的css调用等等。

以下是使用

的代码

from selenium import webdriver

browser = webdriver.Firefox(profile) # Get local session of firefox
browser.get(url) # Open a url and wait for it to finish

Answer 1

我是通过加载firefox插件Firebug和Netexport来实现的。第一个是允许您查看所有信息交换的工具，第二个允许将所有信息写入文件（.har扩展名）。所以基本上selenium必须加载插件，网站并等待你想要的时间，当它关闭时，你得到一个包含结果的文件。

Answer 2

它不是一个python解决方案..但你可以添加fiddler插件到Firefox。一年前我们需要做同样的事情。我们使用selenium打开浏览器和所有UI的东西，在后台Fiddler捕获所有流量（http和https）..这也列出了所有JS CSS src，你可以稍后调试检查员看看发送了什么请求和收到了什么响应

如何在python中捕获流量

2 个答案: