Lucene analyseur Hebrew
Question
Quelqu'un sait-il s'il existe?
J'ai été googler pour cette monthes ...
Merci
La solution
Mise à jour HebMorph
Par curiosité suscitée par votre question, j'ai contacté Itamar Syn-Hershko qui était actif sur les listes de diffusion Lucene il y a environ un an quand il travaillait sur un analyseur hébreu pour Lucene. Je lui ai demandé s'il a terminé son analyse. Voici quelques bits pertinents de sa réponse:
Pour faire une histoire courte, je ne n'a pas. Il n'y a pas décent libre / analyseur Hebrew open-source pour Lucene, que je peux dire à coup sûr. je suis ne sais pas quel est votre parcours sur le sujet, mais croyez-moi quand je dis il n'y a pas moyen facile de le faire; il peut être aussi le Lucene ne se construit pas pour les recherches en hébreu, mais je suis d'accord un solution doit être donnée. Certes, la moyen le plus sûr d'indexer et de rechercher l'hébreu textes est d'utiliser un égrappoir spécialisé, et l'intégration avec Lucene est pas plus facile même après que vous avez fait cela. Il y a quelques très bonnes solutions pour la recherche en hébreu sur le marché, seulement un que je connais utilise Lucene en il est noyau; J'ai récemment essayé les contacter, pas encore la réponse ...
Le produit commercial basé sur Lucene qui est mentionné est appelé Attivio et le site Attivio ne prétendent avoir support Hebrew. SIGTRS (Texte en hébreu groupe d'intérêt de recherche) , il y a eu quelques discussion concernant Attivio qui prétend qu'il est basé Lucene.
Donc, apparemment, il est possible de créer un analyseur hébreu décent pour Lucene, mais il n'y a pas analyseur libre disponible à ce moment.
Autres conseils
dtSearch a un appel provenant Hebrew plugin "PENSIM". Il semble être développé par « wizcomtech.com ».