Quali sono le lingue, i quadri, e le tecnologie hanno utilizzato per implementare la ricerca dei documenti?

StackOverflow https://stackoverflow.com/questions/2765922

Domanda

Sono in una nuova società e uno dei nostri obiettivi è quello di implementare un portale di ricerca dei documenti per la nostra squadra e dei nostri clienti. Sono un po 'preoccupato che se usiamo un provider di servizi esterno come Salesforce o qualche altro ECM nel cloud ci saranno un sacco di lavoro di integrazione in futuro. Dal punto di vista del cliente, potranno esistere anche questi documenti nello stesso secchio come il contenuto più strutturato (memorizzati nel DB, non è un documento MS Word).

Se è stato implementato documento di ricerca, quali lingue, framework e tecnologie hai utilizzato? Avete storie di fallimento? Non ho un problema con qualcosa fuori dalla scatola, ma penso che sia importante che noi abbiamo il controllo sui documenti e l'API per accedervi. Vorrei utilizzare Rails se andiamo completamente personalizzato.

È stato utile?

Soluzione

A seconda della licenza ha bisogno Lucene (LGPL) e Xapian (GPL) entrambi sono grandi, maturi, veloce motore di ricerca API con attacchi per un sacco di lingue. Ho usato tutti e due con grande successo.

Altri suggerimenti

Lucene è probabilmente la scelta più sicura perché è ampiamente utilizzato e abbastanza buono.

Il modo più semplice per beneficiare di Lucene è probabilmente con Alfresco , che è un gioco da ragazzi per l'installazione, e ha Lucene per impostazione predefinita. Significa che solo bisogno di installare Alfresco, mettere i documenti nel repository, e si può cercare per i vostri documenti utilizzando il potente interfaccia di ricerca web.

Se avete bisogno di cercare a livello di codice, la mia raccomandazione è di usare Alfresco' CMIS interfaccia, che ti permette di cercare in modo REST. L'API JCR è inoltre disponibile.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top