使用Selenium自动从Ghostery插件中记录广告数据?

时间:2014-07-04 22:57:08

标签: python selenium browser-plugin

我有兴趣关注哪些广告网络在各种网站上运行。 Ghostery浏览器插件可以很好地向我展示在任何网站上使用的广告网络。例如,在StackOverflow上,Ghostery表示我们正在接受DoubleClick,Google Analytics,Quantcast和ScoreCard的监控。

每周,我想使用Selenium自动浏览几百个网站并保存与这些网站相关的Ghostery数据。使用Selenium的Python绑定,我写了一些粗略的伪代码:

import selenium.webdriver as webdriver
urls = ['www.stackoverflow.com', 'www.amazon.com', ...]
driver = webdriver.Firefox()
for url in urls:
    driver.get(url)
    # now, how do I access Ghostery's analysis of this URL?

我认为更广泛的问题是“来自Selenium,如何连接到其他浏览器插件?


为了好玩,我发布了一个Ghostery的UI看起来像(我想以编程方式访问)的例子:

enter image description here

3 个答案:

答案 0 :(得分:1)

Selenium用于访问浏览器DOM并与之互动。 Selenium无法访问浏览器的控件;对于你想要完成的事情来说,这是一个完全不合适的工具。

答案 1 :(得分:1)

通常,Selenium不可能直接访问扩展。如果你想这样做,你将不得不建立一座桥梁。

对于Ghostery,具体来说,您在寻找的是一个开源项目:https://github.com/ghostery/areweprivateyet

答案 2 :(得分:0)