GreenPlum vs postgreSql
-
24-10-2019 - |
質問
使用に対する賛否両論は何ですか Greenplum
それ以外の PostgreSQL
WebApp(django
) 環境?
私の腸の反応は、PostgreSQLのオープンソースアプローチと巨大な知識ベースを好むことです。
私の構成(他の構成については聞きたいと思いますが)は、2つのWebサーバーと(現時点で)2つのデータベースサーバーを備えた中規模のビジネスです。
コントラストの領域はバイナリです data crunching
, 、中のノードの数 replication
そして私の個人的なお気に入り: communitiy support
熟練したエンジニアのサポート。
PostgreSQLの代わりにGreenPlumを使用することの長所と短所は何ですか?
解決
送信するリンクをすばやくスキミングすることを除いて、GreenPlumについてはあまり知りません。データウェアハウスは、トランザクションオペレーショナルデータストアと同じものではありません。前者は、アドホッククエリ、統計分析、寸法分析、履歴データへの読み物のアクセスのためです。後者は、運用データをリアルタイムで読み取り/書き込みます。彼らは無料です。
postgresqlが欲しいと思います。
誰があなたにグリーンプラムを押しているのですか?その理由は?それが代替として提示されている場合、私はより深く掘り下げて議論に反論します。
他のヒント
GreenPlumは、PostgreSQLのMPP適応です。大規模なデータセットの倉庫および/または分析用に最適化されており、トランザクション環境ではそれほどうまく機能しません。大きなDW環境が必要な場合は、GreenPlumをご覧ください。 OLTPまたは小さいDBサイズ(10TB未満)が必要な場合は、PostgreSQLを確認してください。
GreenPlumは並列処理を利用しているため、マスターノードが基礎となるデータノードと通信してこれらすべてのクエリへの回答を取得する必要があるため、多くの小さな読み取りクエリを実行するオーバーヘッドがあります。ミリ秒をとるクエリの場合、GreenPlumのパフォーマンスが数桁遅くなることを期待してください。
PostgreSQLベースのデータウェアハウジングソリューションを探している場合は、GridSQLも見ていきます。これは、複数のPostgreSQLインスタンスの並列化レイヤーであり、無料でオープンソースです。
他のコメントで述べたように、それは多くの小さなミリ秒クエリではうまく機能しませんが、長期にわたるクエリに大いに役立ちます。 GridSQLには、GreenPlumが持っているColumnarストレージなどのDWの最適化も含まれませんが、並列処理と組み合わせた制約除外パーティション(EX:サブテーブル)を利用して、クエリの結果を高速化することができます。
PostgreSQLはクエリの処理時にのみ単一のコアを使用するため、単一のマルチコアサーバーで使用することもできます。
GreenPlumはMPP分析(OLAP)DBMSです。 PostgreSQLはOLTP DBMSです。一般的に、市場にはOLAPとOLTPの両方が同時に上手になる可能性のある単一のソリューションはありません。あなたはそれについての私の考えを見つけることができます ここ
WebAppバックエンドは、常にOLTPワークロードを作成します。 GreenPlumには、分散システムであるため、トランザクション処理のための大きなオーバーヘッドがありますので、これが500〜600 TPを超えることを期待しないでください。対照的に、ポストグレートは、適切なチューニングで数十万のTPに移動できます。
対照的に、OLAPワークロードが必要な場合、Postgresは単一のホスト処理、動的パーティションの除去、圧縮、柱状ストアのない分割なしでのみ提供できます。 GreenPlumは、クラスター上でデータを並行してクランチできます。
したがって、あなたが探しているソリューションは典型的なデータウェアハウスケースです - 高トランザクションワークロードにOLTPソリューションを使用し、ETL/ELTを使用してDWHにデータを抽出し、その上で複雑なデータクランチクエリを実行します
現時点では、PostgreSQLとGreenPlumの両方がオープンソース製品であるため、それらのいずれかを自由に選択できますが、PostgreSQLコミュニティはより大きなATMです
GreenPlumは並列処理をよりよく活用すると思います。ただし、PostgreSQLに基づいています。
GreenPlumには 無料のコミュニティエディション. 。自分の環境でいつでもダウンロードしてテストできます。
データクランチが1時間以上かかる場合、追加するコアごとに線形パフォーマンスブーストが得られます。クランチに時間がかからないもののために、それは本当に努力する価値はありません。