如何告诉谷歌分析我是一个机器人?

时间:2017-07-10 19:18:15

标签: selenium-webdriver google-analytics bots

我最近编写了一个工具,用于检查网页上的某些请求是否被触发。例如,当我访问StackOverflow时加载的谷歌服务器的jquery?该工具基于webdriver和Chrome浏览器。

该工具就像一个魅力,但它也会产生不应该存在的谷歌分析流量。

是否有可能告诉Google该工具是机器人,不应计算在内?我发现的所有解决方案都集中在被测页面以及如何不通过Google收集数据。我需要一个无需更改网站代码的解决方案。

3 个答案:

答案 0 :(得分:1)

最简单的方法可能是发送自定义用户代理字符串,并通过视图过滤器对其进行过滤。

未经测试,但我认为如果您使用与Google抓取工具相同的用户代理字符串,我很确定它会自动过滤掉(毕竟Google应该足够聪明以过滤自己的抓取工具)。 According to this page Google抓取工具UA始终包含字符串“Googlebot”(否则您必须通过服务器日志查找可能的UA字符串)。

答案 1 :(得分:1)

我们用chrome扩展解决了我们的问题。该扩展程序会将针对Google Analytics端点的所有请求重定向到example.com。像魅力一样。

答案 2 :(得分:0)

以下是您的问题的答案:

了解checks if certain requests on a web page are fired的工具听起来很有趣。 jquery from a google server loaded

实际上,当页面有很多不同之处时,例如手动打开StackOverflow.com(通过手动键入URL),并使用chromedriver exe启动新的Google Chrome会话。

例如,我们手动打开新的Google Chrome会话时,与chrome.exe一起传递的命令行参数为 --flag-switches-begin {{仅限1}}

但是当我们尝试使用--flag-switches-end exe时,我们通常会在chromedriver类和ChromeOptions类的帮助下向Google Chrome会话中添加各种配置参数。除了所有这些之外,还添加了一个参数,即 DesiredCapabilities

因此,--test-type=webdriver exe访问的任何网站始终知道它是 chromedriver

如果这回答你的问题,请告诉我。