Lucene 2.2 analizzatore arabica
Domanda
E 'possibile modificare Lucene 2.2 per aggiungere analizzatore arabo e se qualcuno ha fatto questo già dove posso get source / vaso
Soluzione
qualcuno mi ha chiesto prima di come ottenere il sostegno arabo e persiano su Lucene 2.4
in modo da questi sono stati ufficiosamente backported qui: http://people.apache.org/~rmuir/
http://people.apache.org/~rmuir /lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch
questo significherebbe devi solo effettuare l'aggiornamento a 2.4.1, che potrebbe essere più facile che l'aggiornamento a 2.9 o 3.0.
Spero che questo aiuti
Altri suggerimenti
Lucene 3.0.1 ha araba Analyzer . E 'nella contrib pacchetto .
È possibile effettuare l'aggiornamento a Lucene 3.0.1 per ottenere questo fuori di lavoro della scatola. Probabilmente non sarà in grado di utilizzare questo come lo è per Lucene 2.2 dal TokenStream API sono cambiati in questa release. Ma, back-porting modifiche al 2.2 non dovrebbe essere molto difficile, nel caso in cui non si desidera migrare a ultima release Lucene.
In alternativa, è possibile provare a utilizzare Lucene-hunspell per un analizzatore. Questo sta attualmente lavorando con il tronco Lucene - non so se funziona con Lucene 3.0.1. Ecco spiegazione di Robert Muir e un elenco di dizionari, compreso l'arabo . Credo che si potrebbe anche back-port questo. Il suggerimento di Shashikant sembra più facile da implementare, mentre questo può essere migliore qualità.