Autres conseils

Greenplum est un MPP de PostgreSQL adaption. Il est optimisé pour l'entreposage et / ou des analyses sur les grands ensembles de données et ne procéderait pas que bien dans un environnement transactionnel. Si vous avez besoin d'un grand environnement de DW, regardez Greenplum. Si vous avez besoin OLTP ou plus petites tailles DB (sous 10TB) puis regardez à PostgreSQL.

Depuis Greenplum utilise le traitement parallèle, il y aura des frais généraux avec beaucoup de minuscules en cours d'exécution des requêtes de lecture que les besoins de nœud maître pour communiquer avec les noeuds de données sous-jacentes pour récupérer une réponse à toutes ces questions. Pour une requête qui prend millisecondes, attendez-vous un ordre de grandeur des performances plus lentes pour Greenplum.

Si vous êtes à la recherche d'une solution d'entreposage de données à base PostgreSQL, je regarderais aussi GridSQL. Il est une couche de parallélisation sur plusieurs instances de PostgreSQL, et est gratuit et open source.

Comme mentionné dans d'autres commentaires, il ne fonctionnera pas bien pour de nombreuses petites requêtes milliseconde, mais vous aidera grandement pour longtemps les requêtes en cours d'exécution. GridSQL aussi ne comprend pas les optimisations DW comme le stockage colonnaire Greenplum a, mais vous pouvez profiter de partage d'exclusion contrainte (ex: par les sous-tables plage de dates). Combinés avec le parallélisme pour obtenir vos résultats de la requête plus rapide

Vous pouvez également l'utiliser même sur un seul serveur multi-core, PostgreSQL utilisera uniquement un seul noyau lors du traitement d'une requête.

Greenplum est un SGBD d'analyse MPP (OLAP). PostgreSQL est un SGBD OLTP. Et en général, il n'y a pas une solution unique sur le marché qui peut être bon à la fois OLAP et OLTP en même temps, vous pouvez trouver mes pensées sur elle ici

Le backend WebApp crée toujours la charge de travail OLTP. Greenplum a un gros frais généraux pour le traitement des transactions, car un système distribué, donc ne vous attendez pas à vous livrer plus de 500-600 TPS. Postgres en contraste peuvent aller à des centaines de milliers de TPS avec le réglage droit.

En revanche, lorsque vous avez besoin d'une charge de travail OLAP, Postgres peut vous offrir qu'un seul traitement hôte, sans partage avec l'élimination de la partition dynamique, sans compression, pas de magasin colonnaire. Alors que Greenplum serait en mesure de crunch vos données en parallèle sur le cluster.

Alors la solution que vous cherchez est un cas d'entrepôt de données typique - solution OLTP d'utilisation pour la charge de travail transactionnel haute, extraire les données du DWH avec ETL / ELT, puis exécutez des données complexes croquants requêtes sur elle

À l'heure actuelle à la fois PostgreSQL et Greenplum sont des produits open source, de sorte que vous êtes libre de choisir l'un d'eux, mais la cause communauté PostgreSQL est plus ATM

Je pense que Greenplum tire davantage parti du traitement parallèle. Il est basé sur PostgreSQL, cependant.

Greenplum a édition communautaire gratuite . Vous pouvez toujours télécharger et tester dans votre propre environnement.

Si crissement de données prend plus d'une heure, vous obtiendrez des performances linéaires booste pour chaque noyau que vous ajoutez. Ce n'est pas vraiment l'effort de tout ce qui prend moins de temps à croquer à travers.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top