Pergunta

Eu estava pensando sobre o design de banco de dados do Google Analytics, como eles lidam com os grandes valores em base horária, mesmo em poucos minutos.

Vamos dizer, eles têm 100 milhões de usuários e quase todos os usuários tem 300 balcões em cada minuto. Para um usuário, 300 contadores tem 18.000 linhas em uma hora. Por um dia, é 432k linhas e quase 3 milhões de linhas.

Eu pensei que eles não estão usando um banco de dados relacional, mas não tenho certeza sobre isso ...

Existe alguma sugestão sobre isso?

Saudações,

Foi útil?

Solução

BigTable

E você está certo, eles não são usando um banco de dados relacional.

Outras dicas

Alta escalabilidade tem um resumo da arquitetura do Google aqui . Ele não discute Analytics diretamente, mas ele mostra encaixa como BigTable em todo o infratructure. Eu não tenho certeza que os detalhes do esquema do Google está disponível - como diz o artigo "Infra-estrutura pode ser uma vantagem competitiva." - mas eu acho que é muito mais ligado à implementação de hardware do que um modelo regular de dados seria

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top