谷歌分析数据库设计

时间:2009-09-15 10:14:57

标签: database google-analytics

我想知道Google Analytics数据库设计,它们如何以小时为单位处理巨大的价值,即使在几分钟内也是如此。

让我们说,他们有1亿用户,几乎每个用户每分钟都有300个计数器。对于一个用户,300个计数器在一小时内有18000行。有一天它是432K行和近300万行。

我原以为他们没有使用关系数据库,但不确定...

有什么建议吗?

此致

2 个答案:

答案 0 :(得分:10)

BigTable

你是对的,他们没有使用关系数据库。

答案 1 :(得分:1)

高可扩展性概述了Google的架构here。它没有直接讨论Analytics,但它显示了BigTable如何适应整个基础架构。我不确定谷歌架构的细节是否可用 - 正如文章所说“基础设施可以成为一种竞争优势” - 但我猜它与硬件实现的关系要比常规数据模型更严格。

相关问题