我想知道Google Analytics数据库设计,它们如何以小时为单位处理巨大的价值,即使在几分钟内也是如此。

让我们说,他们有1亿用户,几乎每个用户每分钟都有300个计数器。对于一个用户,300个计数器在一小时内有18000行。有一天它是432K行和近300万行。

我原以为他们没有使用关系数据库,但不确定...

有什么建议吗?

此致

有帮助吗?

解决方案

BigTable

你是对的,他们没有使用关系数据库。

其他提示

高可扩展性总结了Google的架构此处。它没有直接讨论Analytics,但它显示了BigTable如何适应整个基础架构。我不确定谷歌架构的细节是否可用 - 正如文章所说“基础设施可以成为竞争优势” - 但我猜它与硬件实现的关系要比常规数据模型更紧密。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top