design de banco de dados do Google Analytics
-
07-07-2019 - |
Pergunta
Eu estava pensando sobre o design de banco de dados do Google Analytics, como eles lidam com os grandes valores em base horária, mesmo em poucos minutos.
Vamos dizer, eles têm 100 milhões de usuários e quase todos os usuários tem 300 balcões em cada minuto. Para um usuário, 300 contadores tem 18.000 linhas em uma hora. Por um dia, é 432k linhas e quase 3 milhões de linhas.
Eu pensei que eles não estão usando um banco de dados relacional, mas não tenho certeza sobre isso ...
Existe alguma sugestão sobre isso?
Saudações,
Solução
E você está certo, eles não são usando um banco de dados relacional.
Outras dicas
Alta escalabilidade tem um resumo da arquitetura do Google aqui . Ele não discute Analytics diretamente, mas ele mostra encaixa como BigTable em todo o infratructure. Eu não tenho certeza que os detalhes do esquema do Google está disponível - como diz o artigo "Infra-estrutura pode ser uma vantagem competitiva." - mas eu acho que é muito mais ligado à implementação de hardware do que um modelo regular de dados seria