さまざまな種類のデータのインデックス作成にsolrを使用する
質問
新しいプロジェクトでデータのインデックスを作成するために Apache solr の使用を検討しています。データは異なる独立したタイプで構成されているため、たとえば
- 植物学
- 動物
- 車
- コンピューター
インデックスへ。タイプごとに異なるインデックスを使用する必要がありますか、それとも1つのインデックスのみを使用する方が理にかなっていますか?多くのインデックスを使用するとパフォーマンスにどのような影響がありますか? または、これを達成する他の可能性はありますか?
ありがとう。
解決
どちらも正当なアプローチですが、トレードオフがあります。まず、データセットの大きさはどれくらいですか?複数のサーバーにパーティションを分割するのに十分な大きさの場合、異なるインデックスを使用するのが理にかなっています。
第2に、パフォーマンスはどれほど重要か-インデックスを一緒に作成するとパフォーマンスが低下する可能性がありますが、程度はデータの量とクエリが取得できる複雑さによって異なります。
第三に、同じ検索で複数のデータ型を照会する必要がありますか?その場合、すべてを一緒にインデックス化することは、これを可能にする便利な方法です。技術的には個別のインデックスを使用してこれを実現できますが、クエリに最も関連する結果を取得するのは難しいかもしれません(まだではありません)
第4に、単一のスキーマと構成を持つ単一のインデックスにより、システムを展開および保守する人の生活を簡素化できます。
考慮すべきもう1つのことは、IDです。すべての異なるオブジェクトは、すべてのタイプにわたって一意の識別子を持っていますか?そうでない場合、それらを一緒にインデックス付けする場合、おそらくこれを生成する必要があります。
所属していません StackOverflow