Domanda

Con stackoveflow.com in prospettiva (un team di 2-3 ingegneri che costruisce un progetto di sito Web destinato a ridimensionare) ha senso dedicare sforzi all'inizio del processo di sviluppo per costruire una ricerca basata su Lucene / Autonomia & # 8230; al contrario di una ricerca di testo completo basata su database.

Pro / Contro:
Con un'implementazione Lucene matura come nutch o autonomia, il costo del passaggio a Lucene (che è inevitabile) in una fase successiva è trascurabile.
In grandi volumi l'aggiunta di ulteriori server di indicizzazione (diciamo con Nutch) per mantenere l'indice di ricerca in crescita è relativamente semplice.
Con un'implementazione di Lucene, molto probabilmente avrò bisogno di un server aggiuntivo per gestire l'indice in memoria (molto presto nel processo di ridimensionamento).

È stato utile?

Soluzione

Le prestazioni della ricerca full-text del database variano da database a database, ma è di gran lunga l'opzione più semplice da configurare. Quindi inizia con quello e passa a lucene o sfinge se si rivela troppo lento.

Altri suggerimenti

Dovresti comunque tenerlo isolato: non iniziare a lanciare SELECTS su tutto il codice se sai che li sostituirai con una query del motore di ricerca. Avvolgi la ricerca full text del tuo DB con un sottile livello di astrazione che ti assicuri di non usare le funzionalità del database dove non dovresti.

Secondo me la risposta accettata però - l'ottimizzazione prematura qui è decisamente malvagia.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top