我最近编写了一个工具,用于检查网页上的某些请求是否被触发。例如,当我访问StackOverflow时加载的谷歌服务器的jquery?该工具基于webdriver和Chrome浏览器。
该工具就像一个魅力,但它也会产生不应该存在的谷歌分析流量。
是否有可能告诉Google该工具是机器人,不应计算在内?我发现的所有解决方案都集中在被测页面以及如何不通过Google收集数据。我需要一个无需更改网站代码的解决方案。
答案 0 :(得分:1)
最简单的方法可能是发送自定义用户代理字符串,并通过视图过滤器对其进行过滤。
未经测试,但我认为如果您使用与Google抓取工具相同的用户代理字符串,我很确定它会自动过滤掉(毕竟Google应该足够聪明以过滤自己的抓取工具)。 According to this page Google抓取工具UA始终包含字符串“Googlebot”(否则您必须通过服务器日志查找可能的UA字符串)。
答案 1 :(得分:1)
我们用chrome扩展解决了我们的问题。该扩展程序会将针对Google Analytics端点的所有请求重定向到example.com。像魅力一样。
答案 2 :(得分:0)
以下是您的问题的答案:
了解checks if certain requests on a web page are fired
的工具听起来很有趣。 jquery from a google server loaded
。
实际上,当页面有很多不同之处时,例如手动打开StackOverflow.com(通过手动键入URL),并使用chromedriver
exe启动新的Google Chrome会话。
例如,我们手动打开新的Google Chrome会话时,与chrome.exe
一起传递的命令行参数为 --flag-switches-begin
和 {{仅限1}} 。
但是当我们尝试使用--flag-switches-end
exe时,我们通常会在chromedriver
类和ChromeOptions
类的帮助下向Google Chrome会话中添加各种配置参数。除了所有这些之外,还添加了一个参数,即 DesiredCapabilities
。
因此,--test-type=webdriver
exe访问的任何网站始终知道它是 chromedriver
。
如果这回答你的问题,请告诉我。