質問

stackoveflow.comの観点(スケーリングを目的としたWebサイトプロジェクトを構築する2〜3人のエンジニアのチーム)では、Lucene / Autonomyに基づいて検索を構築する開発プロセスの初期段階で努力するのが理にかなっています。データベースベースの全文検索。

長所/短所:
nutchや自律のような成熟したLucene実装では、後の段階でLucene(必然)に移行するコストは無視できます。
大量のインデックスサーバー(たとえば、nutch)を追加して、増加する検索インデックスを維持するのは比較的簡単です。
Luceneの実装では、ほとんどの場合、インメモリインデックスを維持するために追加のサーバーが必要になります(スケーリングプロセスのかなり早い段階で)。

役に立ちましたか?

解決

データベースの全文検索のパフォーマンスはデータベースごとに異なりますが、セットアップするのがはるかに簡単なオプションです。それから始めて、遅すぎると判明した場合は、luceneまたはsphinxに移動します。

他のヒント

ただし、隔離しておく必要があります。検索エンジンクエリで置き換えるとわかっている場合は、コード全体にSELECTをスローしないでください。 DBの全文検索を薄い抽象化層でラップして、データベース機能を使用すべきでない場所で使用しないようにします。

2番目に受け入れられた答えです-ここでの時期尚早な最適化は間違いなく悪です。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top