Domanda

E 'possibile modificare Lucene 2.2 per aggiungere analizzatore arabo e se qualcuno ha fatto questo già dove posso get source / vaso

È stato utile?

Soluzione

qualcuno mi ha chiesto prima di come ottenere il sostegno arabo e persiano su Lucene 2.4

in modo da questi sono stati ufficiosamente backported qui: http://people.apache.org/~rmuir/

http://people.apache.org/~rmuir /lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch

questo significherebbe devi solo effettuare l'aggiornamento a 2.4.1, che potrebbe essere più facile che l'aggiornamento a 2.9 o 3.0.

Spero che questo aiuti

Altri suggerimenti

Lucene 3.0.1 ha araba Analyzer . E 'nella contrib pacchetto .

È possibile effettuare l'aggiornamento a Lucene 3.0.1 per ottenere questo fuori di lavoro della scatola. Probabilmente non sarà in grado di utilizzare questo come lo è per Lucene 2.2 dal TokenStream API sono cambiati in questa release. Ma, back-porting modifiche al 2.2 non dovrebbe essere molto difficile, nel caso in cui non si desidera migrare a ultima release Lucene.

In alternativa, è possibile provare a utilizzare Lucene-hunspell per un analizzatore. Questo sta attualmente lavorando con il tronco Lucene - non so se funziona con Lucene 3.0.1. Ecco spiegazione di Robert Muir e un elenco di dizionari, compreso l'arabo . Credo che si potrebbe anche back-port questo. Il suggerimento di Shashikant sembra più facile da implementare, mentre questo può essere migliore qualità.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top