谷歌分析的数据库架构/数据库设计会是什么样子?

时间:2012-11-10 18:07:22

标签: database-design google-analytics database-schema

我想跟踪我发送给GA跟踪的相同数据,并希望我们自己的本土事件表。 Google的数据库架构对于他们的活动/ GoogleAnalytics会是什么样子。

到目前为止,我有一个带有以下列的事件表,我想知道我是否遗漏了任何重要内容:

事件

id
event-type (ie. event, page-view, custom-var, identity)
domain (ie. sub.main.com, sub2.main.com)
page-url (ie /questions/popular)
action-name (ie. "clicked sign in", "signed up")
session_id (to keep track of entire experience)
user_id (could be nil)
utm_vars (GA source, medium, campaign, etc.)
is_mobile
created_at (timestamp)
data-properties (a hash of other random properties that are being tracked, like "clicked from header", "clicked from footer")

1 个答案:

答案 0 :(得分:0)

我认为谷歌正在使用一些大规模的noSql-thingie,所以谈论谷歌数据库架构可能会有点误导(你的架构看起来很适合你想做的事情,但我猜这是你的问题)。

如果您想确保谷歌拥有相同的数据,您可以使用以下方法将原始数据发送到您自己的服务器:

_gaq.push(['_setLocalGifPath', 'http://yourdomain/phpscript_masking-as-image.gif']);
_gaq.push(['_setLocalRemoteServerMode']);

(这些目的是由自托管的,现已停产的海胆分析产品处理,使用与GA相同的格式)。

此功能会将附加跟踪数据的utm跟踪gif请求发送给GA和您自己的服务器。您可以编写一个掩盖为gif的PHP脚本并解析事件的跟踪请求(更有可能您希望将信息写入文件并在后台解析它以免导致服务器关闭 - GA发送了大量的GIF )。这样您就不需要考虑自己的数据收集机制了。