Googleアナリティクスデータベースの設計
-
07-07-2019 - |
質問
Googleアナリティクスのデータベース設計について、それらが巨大な値を1時間ごと、さらには数分で処理する方法について疑問に思っていました。
たとえば、1億人のユーザーがいて、ほぼすべてのユーザーが毎分300のカウンターを持っているとします。 1人のユーザーの場合、300のカウンターには1時間で18000の行があります。 1日は432K行、ほぼ300万行です。
彼らはリレーショナルデータベースを使用していないと思っていましたが、それについては確信がありません...
それについて何か提案はありますか?
よろしく、
解決
そしてあなたは正しい、彼らはリレーショナルデータベースを使用していません。
他のヒント
高スケーラビリティには、Googleのアーキテクチャの概要がこちらにあります。分析については直接説明しませんが、BigTableがインフラストラクチャ全体にどのように適合するかを示しています。 Googleのスキーマの詳細が利用可能かどうかはわかりません-「インフラストラクチャは競争上の優位性になる可能性がある」と記事に書かれているように-しかし、通常のデータモデルよりもハードウェアの実装により密接に関係していると思います。
所属していません StackOverflow