Greenplum vs PostgreSQL
-
24-10-2019 - |
Question
Quels sont les arguments pour et contre l'utilisation
La solution Je ne sais pas beaucoup sur Greenplum, sauf pour écumer rapidement le lien que vous envoyez. Un entrepôt de données ne sont pas la même chose que d'un magasin de données opérationnelles des transactions. Le premier est pour des requêtes ad hoc, analyse statistique, analyse dimensionnelle, principalement en lecture l'accès aux données historiques. Ce dernier est pour en temps réel, lecture / écriture des données opérationnelles. Ils sont gratuits. Je devine que vous voulez PostgreSQL. Qui pousse Greenplum sur vous et pourquoi? Si elle est présentée comme une alternative, je creuser plus profondément et de réfuter l'argument. Greenplum
au lieu de
Autres conseils
Greenplum est un MPP de PostgreSQL adaption. Il est optimisé pour l'entreposage et / ou des analyses sur les grands ensembles de données et ne procéderait pas que bien dans un environnement transactionnel. Si vous avez besoin d'un grand environnement de DW, regardez Greenplum. Si vous avez besoin OLTP ou plus petites tailles DB (sous 10TB) puis regardez à PostgreSQL.
Depuis Greenplum utilise le traitement parallèle, il y aura des frais généraux avec beaucoup de minuscules en cours d'exécution des requêtes de lecture que les besoins de nœud maître pour communiquer avec les noeuds de données sous-jacentes pour récupérer une réponse à toutes ces questions. Pour une requête qui prend millisecondes, attendez-vous un ordre de grandeur des performances plus lentes pour Greenplum.
Si vous êtes à la recherche d'une solution d'entreposage de données à base PostgreSQL, je regarderais aussi GridSQL. Il est une couche de parallélisation sur plusieurs instances de PostgreSQL, et est gratuit et open source.
Comme mentionné dans d'autres commentaires, il ne fonctionnera pas bien pour de nombreuses petites requêtes milliseconde, mais vous aidera grandement pour longtemps les requêtes en cours d'exécution. GridSQL aussi ne comprend pas les optimisations DW comme le stockage colonnaire Greenplum a, mais vous pouvez profiter de partage d'exclusion contrainte (ex: par les sous-tables plage de dates). Combinés avec le parallélisme pour obtenir vos résultats de la requête plus rapide
Vous pouvez également l'utiliser même sur un seul serveur multi-core, PostgreSQL utilisera uniquement un seul noyau lors du traitement d'une requête.
Greenplum est un SGBD d'analyse MPP (OLAP). PostgreSQL est un SGBD OLTP. Et en général, il n'y a pas une solution unique sur le marché qui peut être bon à la fois OLAP et OLTP en même temps, vous pouvez trouver mes pensées sur elle ici
Le backend WebApp crée toujours la charge de travail OLTP. Greenplum a un gros frais généraux pour le traitement des transactions, car un système distribué, donc ne vous attendez pas à vous livrer plus de 500-600 TPS. Postgres en contraste peuvent aller à des centaines de milliers de TPS avec le réglage droit.
En revanche, lorsque vous avez besoin d'une charge de travail OLAP, Postgres peut vous offrir qu'un seul traitement hôte, sans partage avec l'élimination de la partition dynamique, sans compression, pas de magasin colonnaire. Alors que Greenplum serait en mesure de crunch vos données en parallèle sur le cluster.
Alors la solution que vous cherchez est un cas d'entrepôt de données typique - solution OLTP d'utilisation pour la charge de travail transactionnel haute, extraire les données du DWH avec ETL / ELT, puis exécutez des données complexes croquants requêtes sur elle
À l'heure actuelle à la fois PostgreSQL et Greenplum sont des produits open source, de sorte que vous êtes libre de choisir l'un d'eux, mais la cause communauté PostgreSQL est plus ATM
Je pense que Greenplum tire davantage parti du traitement parallèle. Il est basé sur PostgreSQL, cependant.
Greenplum a édition communautaire gratuite . Vous pouvez toujours télécharger et tester dans votre propre environnement.
Si crissement de données prend plus d'une heure, vous obtiendrez des performances linéaires booste pour chaque noyau que vous ajoutez. Ce n'est pas vraiment l'effort de tout ce qui prend moins de temps à croquer à travers.