我搜索了很多,到目前为止无法确定如何访问页面中的第三方跟踪参数。使用下面的代码,我可以通过python请求包访问页面的cookie,但仅针对本地域,不返回任何第三方cookie /域:
import requests
# create session
s = requests.session()
# read data from a page
r = s.get('https://pythonprogramming.net/parsememcparseface/')
# show cookies and the domain that the cookies belongs to
print('>> printing cookies ...')
for cookie in s.cookies:
print(cookie)
print('domain=' + cookie.domain)
print(' ck_name: ' + cookie.name)
print(' ck_val: ' + cookie.value)
print(' expires: ' + str(cookie.expires))
print()
# paramaters come back empty ...
print('>> printing parameters ...')
for param in s.params:
print(param)
我还尝试使用Chrome驱动程序通过Selenium:
import time
from selenium import webdriver
driver = webdriver.Chrome(r'{path}\chromedriver\chromedriver.exe')
driver.get('https://pythonprogramming.net/parsememcparseface/')
print('Page opened ...')
# here I can access the page HTML and local session via the driver variable
driver.quit() # close page
但第三部分跟踪参数让我望而却步。为了澄清,在https://pythonprogramming.net/parsememcparseface/页面上,Chomrt Dev工具显示有一个Google Analytics收集器可以根据此图像运行并返回参数:
任何帮助将不胜感激! 谢谢
答案 0 :(得分:0)
Cookie只能从设置它们的域中读取,这就是Cookie的工作方式。
Google Analytics不会使用第三方Cookie中的数据。它需要运行的唯一cookie是带有clientId的_ga cookie,它是由注入的javascript设置的第一方cookie。