Вопрос

Мне было интересно, как устроена база данных Google Analytics, как они обрабатывают огромные значения ежечасно или даже за минуты.

Допустим, у них 100 миллионов пользователей и почти у каждого пользователя каждую минуту 300 счетчиков.На одного пользователя 300 счетчиков имеют 18000 строк за один час.За один день это 432 тыс. строк и почти 3 миллиона строк.

Я думал, что они не используют реляционную базу данных, но не уверен в этом...

Есть ли какие-либо предложения по этому поводу?

С уважением,

Это было полезно?

Решение

Большой стол

И вы правы, они не используют реляционную базу данных.

Другие советы

Высокая масштабируемость содержит краткое описание архитектуры Google. здесь.Здесь не обсуждается аналитика напрямую, но показано, как BigTable вписывается во всю инфраструктуру.Я не уверен, что подробности схемы Google доступны — как говорится в статье «Инфраструктура может быть конкурентным преимуществом», — но я предполагаю, что она гораздо более тесно связана с аппаратной реализацией, чем обычная модель данных.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top