문제

ROR 앱에 전체 텍스트 검색 기능을 추가하려고하지만 아랍어와 관련하여 몇 가지 문제에 직면 해 있습니다. Afaik, 아랍어 줄기, 형태 및 기타 고급 텍스트 검색을 지원하는 검색 엔진이 많지 않습니다. 내가 찾은 유일한 것은 Aramorph Tokenizer와 Lucene이었습니다.

ACTS_AS_SOLR 플러그인 (Solr은 Lucene을 기반으로 하며이 플러그인은 레일과 통합)이 버려진 것으로 보이며 도움이되는 문서를 찾을 수 없습니다.

나는 Sphinx, Xapian, Ferret 및 Acts_as_searchable을 살펴 보았지만 그중 어느 누구도 내 지식을 최대한 활용할 수있는 고급 아랍어 검색 기능을 제공하지 않습니다.

모든 도움이 정말 감사하겠습니다

== 업데이트
Sphinx를 사용하는 제안이 있으며 이전 프로젝트에서 사용했으며 잘 작동합니다. 그러나 고급 검색 기능을 제공하지 않습니다.
예를 들어, 단어는 다음과 같습니다. 나는 "작가"를 검색하고 같은 줄기에서 파생 된 모든 단어에 대한 결과를 얻을 수있는 능력을 갖고 싶습니다.
또한, 나는 검색이 일반적인 아랍어 독립 스타일을 고려하기를 원합니다. 어떤 사람들은 "hamza"(우리는)를 사용하고 어떤 사람들은 그렇지 않습니다. 다른 사람들은 "taa marboota"(التا المرر팡인)와 함께 단어를 씁니다. 다른 사람들은 "haa"(الهاء)를 사용합니다. 좋은 아랍어 검색 엔진은 그러한 미묘한 차이를 깨닫고 그것들을 찾아야합니다.

스핑크스를 사용하면 검색 한 내용 만 얻을 수 있으며 아랍어로 그러한 문제를 수용하는 유일한 엔진은 Aramorph Tokenizer와 함께 Lucene이었습니다. 그러나 ACTS_AS_SOLR (레일 용 Lucene 플러그인)이 버려집니다. 내 질문은 다음과 같습니다. 검색 엔진에 대한 다른 토큰 화기가 있습니까?
Kandadaboggu는 Sunspot을 언급했습니다.

도움이 되었습니까?

해결책

사고 스핑크스 옵션을 확장하여 시도해야합니다

이것을 읽으십시오 : http://www.expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

다른 팁

Solr 사용을 위해 태양 흑점 그리고 태양 흑점 레일.

스핑크스 사용 스핑크스 생각

두 보석 모두 우수하고 설치 기반이 크다. 몇 가지 프로젝트에서 ThinkingSphinx를 사용했으며 강력히 추천합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top