Domanda

Ho una soluzione di storage con un tavolo Azure con fino a qualche tusands "righe" per cliente (chiave di partizione).

Come faccio meglio fare un fulmine veloce ricerca a testo libero?

A causa della natura dei dati che non sono in grado di fare una ricerca del foro di parola (ad es. Una ricerca per "zur" deve corrispondere "Azure").

È stato utile?

Soluzione

Proprio notato questo, che può aiutare: Azure libreria per Lucene

Altri suggerimenti

Stiamo usando il seguente nella produzione per i nostri siti: Corriamo solr ospitato (sulla base di Lucene) casi su http: // websolr. it e memorizzare nella cache i risultati utilizzando la nuova funzionalità di cache distribuita azzurro che è attualmente in beta. Questo ci dà un caso peggiore di 200 ms di latenza per una richiesta di ricerca iniziale tra il data center di Amazon dove websolr.com corre e l'Azure Datacenter e una media di 6 - 10 ms per tutte le ricerche nella cache. Abbiamo inoltre registrare ricerca comune frammenti di testo e cerchiamo di mantenerli freschi nella cache.

Al momento non v'è dalla soluzione scatola per questo. Forse una funzione di ricerca testo completo sarà annunciato al PDC10.

Quindi al momento è necessario ruotare la propria soluzione indicizzazione di testo. Il modo in cui ho fatto questo è con la costruzione di un indice Lucene.net su un ruolo di lavoro. Poi ho aperto una porta TCP in quel ruolo lavoratore che fornisce un servizio di ricerca utilizzando WCF. Qualsiasi ruolo web può quindi consumare tale servizio. Questo funziona molto bene e offre un servizio molto veloce la ricerca.

C'è un video PDC09 da Steve Marx che fornisce maggiori informazioni: http://www.microsoftpdc.com / 2009 / SVC16

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top