我想弄清楚在将NoScript / ghostery等插件应用到某个网页之前和之后的更改。 NoScript / ghostery阻止跟踪器和广告商的脚本并将其从DOM树中删除(例如,我在Firefox中“启用”NoScript之前和之后浏览cnn.com时检查了它是“http://a.visualrevenue.com/vrs.js”。但是,如果我使用selenium的browser.get_source转储DOM树,“http://a.visualrevenue.com/vrs.js”仍然存在。我在这个过程中使用以下代码:
import pickle
from selenium import webdriver
fp = webdriver.FirefoxProfile(../<extension/addons/>)
browser = webdriver.Firefox(firefox_profile=fp)
browser.get("http://www.cnn.com")
html_source = browser.page_source
f = open("cnn.p", "wb")
pickle.dump(html_source, f)
答案 0 :(得分:1)