我尝试识别包含特定标记的网页,但是此标记包含在Google跟踪代码管理器中,因此在页面源或DOM(从我的内容)中无法使用可以看到。)
但是,我可以在“网络”标签上的Chrome开发者工具中查看与相关标签相关的请求。
我想知道是否有办法在python中加载页面并跟踪加载页面时发出的所有请求,以便我可以解析此列表中的标识符。
不确定是否有明显的这样做,但我似乎无法在请求模块或urllib3中找到任何相关内容。
编辑 - 更多信息:
我专门尝试识别AdWords转化标记。我知道这需要https://www.google.com/ads/conversion/xxxxxxxxxx/
的请求。对于大多数站点,代码在页面源中可见,或者有时仅在DOM中可见。我使用了前者的请求模块,后者使用了phantomjs。但是,如果网站使用的是Google跟踪代码管理器,则它似乎也不在其中。
但是,我可以在网络标签上的Chrome开发工具中看到此请求,所以希望有一种方法可以直接在python中复制它吗?
答案 0 :(得分:0)
在PhantomJS中尝试使用OnResourceRequested后出现了一些痛苦,我改为使用以下内容:
chromedriver = "/path/to/chromedriver"
os.environ["webdriver.chrome.driver"] = chromedriver
self.driver = webdriver.Chrome(chromedriver)
self.driver.get(link)
time.sleep(5)
timings = self.driver.execute_script("return window.performance.getEntries();")
for item in timings:
print item[u'name']