Question

Je suis en train d'ajouter des capacités de recherche en texte intégral à mon application RoR, mais face à des problèmes en matière de langue arabe. Autant que je sache, il n'y a pas beaucoup de moteurs de recherche là-bas qui prennent en charge l'arabe égrappage, la morphologie et d'autres recherche texte intégral avancé. La seule chose que j'ai trouvé Lucene avec le tokenizer AraMorph.

Le plugin acts_as_solr (SOLR est basé sur Lucene, et ce plugin intègre avec Rails) semble être abandonné, et je ne peux pas trouver toute la documentation utile.

Je l'ai regardé dans sphynx, xapian, ferret et acts_as_searchable mais aucun d'entre eux offre une fonctionnalité de recherche avancée arabe au meilleur de ma connaissance.

Toute aide serait vraiment apprécié

== Mise à jour
J'ai des suggestions à utiliser sphynx, et je l'ai fait l'utiliser sur un projet antérieur, et il fonctionne très bien. Toutefois, il ne fournit pas de capacités de recherche avancée.
par exemple, les mots: كتاب (livre), مكتبة (bibliothèque), et كاتب (écrivain) sont tous issus de la même souche كتب. Je veux avoir la possibilité de rechercher des « écrivain » et obtenir des résultats pour tous les mots dérivés de la même racine.
De plus, je veux la recherche de prendre en compte les styles arabes communs de dictée. Certains utilisent le « hamza » (همزة) et certaines personnes ne le font pas. D'autres écrivent des mots avec la lettre « taa marboota » (التاء المربوطة) tandis que d'autres utilisent la lettre « haa » (الهاء). Un bon moteur de recherche arabe devrait se rendre compte de telles différences subtiles et les chercher.

Avec vous obtenez seulement sphynx ce que vous recherchez, et le seul moteur que je trouve pour tenir compte de ces questions dans la langue arabe, était Lucene avec AraMorph tokenizer. Cependant, acts_as_solr (le plugin Lucene pour rails) est abandonné. Ma question est: est-il un autre tel tokenizer pour un moteur de recherche
? KandadaBoggu mentionné sunspot, je vais vous donner qu'un aller et retour répondre

Était-ce utile?

La solution

Vous devriez essayer en étendant les options Thinking Sphinx

Lire ceci: http: // www. expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

Autres conseils

Pour utiliser Solr Sunspot et Tache Rails .

Pour utiliser Sphinx Thinking Sphinx

Les deux gemmes sont excellents et ont une grande base installée. Je l'ai utilisé ThinkingSphinx dans quelques projets et je le recommande vivement.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top