Pregunta

Estoy tratando de añadir capacidades de búsqueda de texto completo a mi aplicación RoR, pero frente a algunos problemas cuando se trata de árabe. Que yo sepa, no hay muchos motores de búsqueda por ahí que apoyan árabe derivada, morfología y otra de búsqueda de texto completo avanzado. Lo único que encontré fue Lucene con el tokenizer AraMorph.

El plugin parece acts_as_solr (Solr está basado en Lucene, y este plugin se integra con carriles) para ser abandonada, y no puedo encontrar ninguna documentación útil.

He mirado en la esfinge, xapian, hurón, y acts_as_searchable pero ninguno de ellos ofrece la funcionalidad de búsqueda avanzada árabe a lo mejor de mi conocimiento.

Cualquier ayuda sería muy apreciada

== Actualización
Tengo sugerencias para utilizar la esfinge, y lo hice usarlo en un proyecto anterior, y funciona muy bien. Sin embargo, no proporciona ninguna capacidad de búsqueda avanzada.
por ejemplo, las palabras: كتاب (libro), مكتبة (biblioteca), y كاتب (escritor) se derivan de la misma raíz كتب. Quiero tener la capacidad de búsqueda de "escritor" y obtener resultados para todas las palabras derivadas de la misma raíz.
Además, quiero la búsqueda para tener en cuenta los estilos de dictado árabes comunes. Algunos utilizan el "Hamza" (همزة) y algunas personas no lo hacen. Otros escriben palabras con la letra "taa marboota" (التاء المربوطة) mientras que otros utilizan la letra "haa" (الهاء). Un buen motor de búsqueda árabe debería darse cuenta tales diferencias sutiles y buscar para ellos.

Con la esfinge que sólo recibe lo que se busca, y el único motor que encontré para dar cabida a estas cuestiones en el idioma árabe, era Lucene con tokenizer AraMorph. Sin embargo, se abandona acts_as_solr (el plugin lucene para los carriles). Hay cualquier otro tokenizer para cualquier motor de búsqueda
: Así que mi pregunta es? KandadaBoggu mencionó manchas solares, voy a dar que un ir y responder de nuevo

¿Fue útil?

Solución

Usted debe tratar esta extendiendo Pensando opciones Sphinx

Lea esto: http: // www. expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

Otros consejos

Para Solr utilizar Sunspot y Sunspot Rails .

Para usar Sphinx Pensando Sphinx

Los dos gemas son excelentes y tienen una gran base de instalación. He utilizado ThinkingSphinx en pocos proyectos y yo lo recomiendo.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top