如何在python中捕获流量

时间:2013-07-17 21:44:59

标签: python selenium selenium-webdriver

我有一个使用selenium的webdriver,它为我打开一个浏览器,将它指向一个ip地址,做了很多东西并关闭。

我想知道在此期间访问的所有网址。也就是说,任何已加载的广告,任何对任何网址发出的css调用等等。

以下是使用

的代码
from selenium import webdriver

browser = webdriver.Firefox(profile) # Get local session of firefox
browser.get(url) # Open a url and wait for it to finish

2 个答案:

答案 0 :(得分:1)

我是通过加载firefox插件Firebug和Netexport来实现的。第一个是允许您查看所有信息交换的工具,第二个允许将所有信息写入文件(.har扩展名)。所以基本上selenium必须加载插件,网站并等待你想要的时间,当它关闭时,你得到一个包含结果的文件。

答案 1 :(得分:1)

它不是一个python解决方案..但你可以添加fiddler插件到Firefox。一年前我们需要做同样的事情。我们使用selenium打开浏览器和所有UI的东西,在后台Fiddler捕获所有流量(http和https)..这也列出了所有JS CSS src,你可以稍后调试检查员看看发送了什么请求和收到了什么响应