Colonne magasin sur Hadoop?
-
10-10-2019 - |
Question
Y at-il un magasin de colonne similaire à Vertica qui est construit au-dessus de Hadoop .. Je ne parle pas HBase car il est le magasin de matrice creuse et ne peut pas obtenir le niveau de compression qui peut être atteint par quelque chose comme Vertica?
Merci
La solution
Vous cherchez quelque chose comme rcfile ? Il est un type de fichier qui utilise un magasin colonnaire interne.
Autres conseils
rcfile est un bon début. Rcfile stocke les données dans une mise en page PAX - colonnaires dans des blocs qui pourraient être aussi grand que la taille du bloc de HDFS. Il y a un document à VLDB 2011 décrivant un autre format de stockage colonnaire ici et un billet de blog avec une brève comparaison à rcfile .
Je n'ai pas travaillé avec Hadoop, mais je sais que Vertica a essayé d'intégrer avec Hadoop.
Regardez sur Hadapt http://hadapt.com/
Ceci est une version commerciale de HadoopDB http://db.cs.yale.edu /hadoopdb/hadoopdb.html développé à l'Université de Yale. Il peut travailler avec une base de données en colonnes (qui est installé sur chaque noeud d'une grappe d'ordinateurs), tandis que pour l'exécution des leviers Hadoop à tolérance de pannes.