从Google Analytics到(几乎)access.log

时间:2016-10-23 10:11:58

标签: logging google-analytics access-log

背景信息:许多人希望从Google Analytics导出数据并迁移到其他分析工具,但还没有现成的工具,请参阅this issue of a well-known open-source project

根据in this questionhere as well所述,似乎无法从Google Analytics获取原始日志。 当然,可以使用他自己的Apache access.log文件,但这些文件并不总是可用(例如我从5年前开始存储日志,因为我知道所有内容都在谷歌分析中,现在我看到了我的错误!)。

部分解决方案可能是:让我们将Google Analytics数据导出为类似Apache的access.log文件。然后,可以在任何分析工具中轻松导入此数据。

问题:我已经探索了Google Analytics GUI,但我找不到允许批量导出所有过去流量的功能,作为表单中的日志文件(包括引荐来源,用户代理等)< / p>

mywebsite.com:5.130.131.132 - - [23/Oct/2016:12:08:58 +0200] "GET /bla/abc.php HTTP/1.1" 302 241 "http://www.blabla.com" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36"

Google Analytics中是否有允许执行此操作的功能?

1 个答案:

答案 0 :(得分:0)

不,由于各种原因:

  • Google Analytics不会公开IP地址
  • GA记录跟踪对Google服务器的请求,而不是对您自己的服务器的请求,因此GA不会知道资源的请求方法
  • dito用于响应状态(如果默认情况下已达到GA 200,否则不会记录命中)和内容长度
  • 我认为GA不会公开完整的用户代理字符串

您必须通过自定义维度和/或override the sendHitTask添加此信息,才能将(未处理的)数据的副本发送到您自己的跟踪服务器。在这种情况下,您必须在所有错误页面上实现GA(对于40x和50x错误状态),当然它只适用于未来的数据,它仍然无法帮助已经收集的数据。

高级版GA(最近更名为Google Analytics 360)允许使用(via BigQuery) for more data fields to be exported,但这样可以让您每年回拨15万美元,因此可能不是一种选择。