Frage

Ich bin versuchen, um eine Volltextsuche zu meiner RoR-app, aber vor einige Probleme, wenn es um Arabisch.AFAIK, es gibt nicht viele Suchmaschinen gibt, die Unterstützung der arabischen Wortstamm, Morphologie und andere erweiterte full-text search.Das einzige, was ich fand, war Lucene mit dem AraMorph tokenizer.

Die acts_as_solr plugin (solr basiert auf lucene, und dieses plugin integriert, mit Schienen) scheint aufgegeben zu sein, und ich finde keine nützliche Dokumentation.

Ich habe in der sphinx, xapian, Frettchen, und acts_as_searchable aber keiner von Ihnen bietet erweiterte Arabisch-Suchfunktion nach meinem besten wissen.

Jede Hilfe wäre wirklich zu schätzen

== Update
Ich habe Vorschläge zur Verwendung der sphinx, und ich habe es auf einem früheren Projekt, und es funktioniert gut.Aber es bietet keine erweiterte Suchfunktionen.
für Beispiel, die Worte:كتاب (Buch), مكتبة (Bibliothek), und كاتب (writer) sind alle aus dem gleichen Stamm كتب.Ich möchte die Fähigkeit haben, suchen Sie nach "writer" und erhalten Sie Ergebnisse für alle Begriffe stammen aus dem gleichen Stamm.
Außerdem will ich die Suche berücksichtigt gemeinsamen Arabisch-Diktat-Stile.Einige nutzen die "hamza" (همزة) und manche Leute nicht.Andere schreiben Wörter mit dem Buchstaben "taa marboota" (التاء المربوطة), während andere verwenden den Buchstaben "haa" (الهاء).Eine gute Arabisch-Suchmaschine bewusst sein sollte, solche feinen Unterschiede und die Suche nach Ihnen.

Mit sphinx, die Sie nur bekommen, was Sie suchen, und der einzige Motor, die ich gefunden, um Platz für solche Fragen in Arabischer Sprache, war Lucene mit AraMorph tokenizer.Jedoch, acts_as_solr (die lucene-plugin für rails), wird aufgegeben .Also meine Frage ist:gibt es eine andere solche tokenisierung für Suchmaschinen?
KandadaBoggu genannten Sonnenflecken, werde ich probieren, und reagieren Sie zurück

War es hilfreich?

Lösung

Sie sollten versuchen, diese durch Denken Sphinx Optionen erstreckt

Lesen Sie diese: http: // www. expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

Andere Tipps

Für Solr verwenden Sunspot und Sonnenfleck-Schienen.

Für Sphinx verwenden Denken Sphinx

Beide Edelsteine sind ausgezeichnet und haben eine große installierte Basis.Ich habe verwendet ThinkingSphinx in wenigen Projekte und I hoch empfehlen es.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top