質問

私は、例えば、フォーマット{document => {term => weight}}の数百万個のエントリにプッシュすることができますストアとしてのHBaseを使用したいです「重量ZとドキュメントYに用語のXを挿入」とし、「このドキュメントの上位1000語を選択する」または「文書ごとに上位1000語を選択」のようなコマンドを発行します。これは私の現在のMySQLの実装で動作しますが、おそらくドメインはHBaseのに適しています。私は、HBaseのとBigTableのは、同様の問題領域であるフルテキストインデックスに使用されていることに注意します。

私はHBaseの上の数ページを読んでより多くを行っていませんでしたが、私はあなたが私の質問の主旨を理解してほしいことを伝えることができます。この質問をhref="https://stackoverflow.com/questions/1683563/is-hbase-meaningful-if-its-not-running-in-a-distributed-environment">

可能な障壁はLIMIT句と同等でクエリを許可しないのHBaseが含まれる場合があります。私は重量で照会することを考えると、私は(私はHBaseのが唯一のユニークなキーを許可することを前提と)同じ重みを持つ2つの観点では問題となると思われる、{weight => term}を関連付けしたいと思います。また私は、所定の重量のための用語のコレクションを保管しなければならないが、これは正確に返される用語の数を制限するために自分の能力を制限する。

役に立ちましたか?

解決

簡単な答えはいます。

より複雑な答えは、今日のデータストアのそれぞれ独自のプログラマーインターフェイスを実装し、「何のSQLは」彼らはSQLベースでない意味しないとして、これらの「NO SQL」。だから、その困難のどれもかかわらず、いくつかのコーディングのために準備されます。主にこれらのデータストアは単なる名前と値のペアが格納されている、(HBaseのも柱家族の概念を持っている)、RESTやSOAP経由で得ました。彼らはしかしに向かって自分自身を貸すやっていることは地図、削減クエリの非常に興味深い分野と同様に、最大読む価値があります。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top