如何在页面中访问第三方跟踪参数(通过Python)?

时间:2017-05-07 08:37:25

标签: python selenium cookies google-analytics

我搜索了很多,到目前为止无法确定如何访问页面中的第三方跟踪参数。使用下面的代码,我可以通过python请求包访问页面的cookie,但仅针对本地域,不返回任何第三方cookie /域:

import requests
# create session
s = requests.session()
# read data from a page
r = s.get('https://pythonprogramming.net/parsememcparseface/')
# show cookies and the domain that the cookies belongs to
print('>> printing cookies ...')
for cookie in s.cookies:
    print(cookie)
    print('domain=' + cookie.domain)
    print('   ck_name: ' + cookie.name)
    print('   ck_val:  ' + cookie.value)
    print('   expires: ' + str(cookie.expires))
print()    
# paramaters come back empty ...
print('>> printing parameters ...')
for param in s.params:
    print(param)

我还尝试使用Chrome驱动程序通过Selenium:

import time
from selenium import webdriver
driver = webdriver.Chrome(r'{path}\chromedriver\chromedriver.exe')
driver.get('https://pythonprogramming.net/parsememcparseface/')
print('Page opened ...')
# here I can access the page HTML and local session via the driver variable
driver.quit()   # close page

但第三部分跟踪参数让我望而却步。为了澄清,在https://pythonprogramming.net/parsememcparseface/页面上,Chomrt Dev工具显示有一个Google Analytics收集器可以根据此图像运行并返回参数:

GA collection parameter

任何帮助将不胜感激! 谢谢

1 个答案:

答案 0 :(得分:0)

Cookie只能从设置它们的域中读取,这就是Cookie的工作方式。

Google Analytics不会使用第三方Cookie中的数据。它需要运行的唯一cookie是带有clientId的_ga cookie,它是由注入的javascript设置的第一方cookie。