どのようにコピーを作成し、テーブルHBase同じクラスター?または、どのようなご要望を元の状態営業、作業状態

StackOverflow https://stackoverflow.com/questions/3504626

質問

あるのに有効な方法でコピーを作成しテーブルの構造+データHBase、同じクラスター?明らかにポート先のテーブルが別の名前です。何がその場で発音を確認することがこれまで:

  1. のCopyTable仕事が記載されたツールとしてコピーしたデータの 異なる HBaseクラスターう支援intra-クラスターが知識がないかどうかで処理するように設計されてシナリオの効率化。

  2. の輸出+輸入。その音のようにハックがやって来た私は新しいHBaseそれが実質溶液とはなんですか?

あるでしょう"なぜようにしている関係ではないかと思います。マシナリオにあるのは何百万の物Iアクセスする必要のは、"スナップショット"状態の場合させていただきます。がバッチプロセス毎日運行を更に多くのこれらのオブジェクト。場合にステップとバッチ処理に失敗しながらプレーする必要がありますので"ロールバック"状態となる。なので、このバッチ処理があるための状態となる。

そのため、電流が流れるのは複製元のテーブルを作業コピーも効果的に利用しうることが期待望のテーブルを更新します。の場合はバッチ処理が完了したすべての人に周知し、私のサービスの利用には新しいテーブル、そうでないかを捨てて新します。

この現代美術館などを利用BDBが私に全く新しい世界の大きなデータをもとてもうすること間違いです。い提案のパターンにいるべき使用くもり歓迎いたします。:-)

役に立ちましたか?

解決

すべてのデータにはHBase、一定の時刻です。きを読み込み(取得し、スキャン)パラメータを表示したい最新のバージョンのデータとして指定の時刻です。一つのことができるようになるはいお読み込みサーバーへのご要望をこのパラメータを指す時間前にバッチ処理を開始します。一回のバッチが完了すると、バンプをお読みのタイムスタンプの現在の状態に固定されます。

カップルにも注意する場合、このアプローチ:

  • HBaseテーブルの設定を保存最新のNバージョンを指定の細胞です。場合は上書きのデータ細胞のN新しい価値を失いますの価値の中で、次の圧縮.(を設定することもできますし、TTL終了となる細胞がな音でお客様のご希望に合例)です。
  • 同様に、を削除した場合は、データの一部としており、そのすることはできません読むことのできるうえ、次の圧縮.

なので、かない場合には発行を削除しの一環としてバッチ処理られないときには、いくつかの書きバージョンの同じデータが既に存在するテーブルの上まで設定で保存することができるだ古い要求を出すのと同じテーブルだけを更新中です。これによって、効果的にするこのスナップショット.

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top