Полнотекстовый поиск на арабском языке в RoR
-
19-09-2019 - |
Вопрос
Я пытаюсь добавить возможности полнотекстового поиска в свое приложение RoR, но сталкиваюсь с некоторыми проблемами, когда дело доходит до арабского языка.AFAIK, существует не так много поисковых систем, которые поддерживают арабскую основу, морфологию и другой расширенный полнотекстовый поиск.Единственное, что я нашел, был Lucene с токенизатором AraMorph.
Плагин acts_as_solr (solr основан на lucene, и этот плагин интегрирует его с Rails), похоже, заброшен, и я не могу найти никакой полезной документации.
Я просмотрел sphinx, xapian, ferret и acts_as_searchable, но, насколько мне известно, ни один из них не предлагает расширенных функций поиска по арабскому языку.
Любая помощь была бы действительно оценена
== Обновление
У меня есть предложения по использованию sphinx, и я использовал его в более раннем проекте, и он работает просто отлично.Однако он не предоставляет никаких расширенных возможностей поиска.
например, слова:كتاب (книга), مكتبة (библиотека), и كاتب (писатель) являются производными от той же основы كتب.Я хочу иметь возможность искать "writer" и получать результаты для всех слов, происходящих от одной основы.
Кроме того, я хочу, чтобы при поиске учитывались распространенные стили арабской диктовки.Кто-то использует "хамзу" (яп.هم المزيد), а кто-то нет.Другие пишут слова с буквой "таа марбута" (التاء المربوطة), в то время как другие используют букву "хаа" (الهاء).Хорошая поисковая система на арабском языке должна понимать такие тонкие различия и искать их.
С sphinx вы получаете только то, что ищете, и единственным движком, который я нашел для размещения подобных материалов на арабском языке, был Lucene с токенизатором AraMorph.Однако acts_as_solr (плагин lucene для rails) оставлен .Итак, мой вопрос заключается в следующем:существует ли какой-либо другой подобный токенизатор для любой поисковой системы?
КандадаБоггу упомянул солнечное пятно, я попробую и отвечу в ответ
Решение
Вам следует попробовать это, расширив возможности Thinking Sphinx
Читать это: http://www.expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode
Другие советы
Для использования Solr Солнечное пятно и Рельсы в солнечных Пятнах.
Для использования со Сфинксом Думающий Сфинкс
Оба драгоценных камня превосходны и имеют большую установочную базу.Я использовал ThinkingSphinx в нескольких проектах и настоятельно рекомендую его.