Pergunta

Eu estou tentando adicionar recursos de pesquisa de texto completo para o meu aplicativo RoR, mas enfrentando alguns problemas quando se trata de árabe. AFAIK, não há muitos motores de busca lá fora, que o apoio árabe decorrentes, morfologia e outra pesquisa de texto completo avançada. A única coisa que eu encontrei foi Lucene com o tokenizer AraMorph.

O acts_as_solr plug-in (Solr é baseado no Lucene, e este plugin integra com Rails) parece ser abandonado, e eu não consigo encontrar qualquer documentação útil.

Eu olhei para esfinge, xapian, furão, e acts_as_searchable mas nenhum deles oferece funcionalidade de pesquisa avançada arábica para o melhor de meu conhecimento.

Qualquer ajuda seria muito apreciada

== Atualização
Eu tenho sugestões para uso esfinge, e eu fiz usá-lo em um projeto anterior, e ele funciona muito bem. No entanto, ele não fornece quaisquer capacidades de pesquisa avançadas.
por exemplo, as palavras: ???? (livro), ????? (biblioteca), e ???? (escritor) são todos derivados do mesmo tronco ???. Quero ter a capacidade de procurar por "escritor" e obter resultados para todas as palavras derivadas do mesmo radical.
Além disso, quero a busca levar em estilos ditado árabe conta comuns. Alguns usam a "Hamza" (????) e algumas pessoas não o fazem. Outros escrevem palavras com a letra "taa marboota" (????? ????????), enquanto outros usam a letra "haa" (?????). Um bom motor de busca arábica deve perceber tais diferenças sutis e olhar para eles.

Com esfinge você só recebe o que você procurar, e o único motor que eu encontrei para acomodar essas questões na língua árabe, foi Lucene com AraMorph tokenizer. No entanto, acts_as_solr (o lucene plugins para os trilhos) é abandonado. Então, minha pergunta é: existe algum outro tal tokenizer para qualquer motor de busca
? KandadaBoggu mencionado manchas solares, eu vou dar um que vá, e responder de volta

Foi útil?

Solução

Você deve tentar isso estendendo opções Thinking Sphinx

Leia este: http: // www. expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

Outras dicas

Para uso Solr Sunspot e Sunspot Rails .

Para uso Esfinge Thinking Sphinx

Ambas as gemas são excelentes e têm uma grande base instalada. Eu tenho usado ThinkingSphinx em alguns projetos e eu recomendo-lo.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top