Вопрос

Я пытаюсь добавить возможности полнотекстового поиска в свое приложение RoR, но сталкиваюсь с некоторыми проблемами, когда дело доходит до арабского языка.AFAIK, существует не так много поисковых систем, которые поддерживают арабскую основу, морфологию и другой расширенный полнотекстовый поиск.Единственное, что я нашел, был Lucene с токенизатором AraMorph.

Плагин acts_as_solr (solr основан на lucene, и этот плагин интегрирует его с Rails), похоже, заброшен, и я не могу найти никакой полезной документации.

Я просмотрел sphinx, xapian, ferret и acts_as_searchable, но, насколько мне известно, ни один из них не предлагает расширенных функций поиска по арабскому языку.

Любая помощь была бы действительно оценена

== Обновление
У меня есть предложения по использованию sphinx, и я использовал его в более раннем проекте, и он работает просто отлично.Однако он не предоставляет никаких расширенных возможностей поиска.
например, слова:كتاب (книга), مكتبة (библиотека), и كاتب (писатель) являются производными от той же основы كتب.Я хочу иметь возможность искать "writer" и получать результаты для всех слов, происходящих от одной основы.
Кроме того, я хочу, чтобы при поиске учитывались распространенные стили арабской диктовки.Кто-то использует "хамзу" (яп.هم المزيد), а кто-то нет.Другие пишут слова с буквой "таа марбута" (التاء المربوطة), в то время как другие используют букву "хаа" (الهاء).Хорошая поисковая система на арабском языке должна понимать такие тонкие различия и искать их.

С sphinx вы получаете только то, что ищете, и единственным движком, который я нашел для размещения подобных материалов на арабском языке, был Lucene с токенизатором AraMorph.Однако acts_as_solr (плагин lucene для rails) оставлен .Итак, мой вопрос заключается в следующем:существует ли какой-либо другой подобный токенизатор для любой поисковой системы?
КандадаБоггу упомянул солнечное пятно, я попробую и отвечу в ответ

Это было полезно?

Решение

Вам следует попробовать это, расширив возможности Thinking Sphinx

Читать это: http://www.expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

Другие советы

Для использования Solr Солнечное пятно и Рельсы в солнечных Пятнах.

Для использования со Сфинксом Думающий Сфинкс

Оба драгоценных камня превосходны и имеют большую установочную базу.Я использовал ThinkingSphinx в нескольких проектах и настоятельно рекомендую его.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top