Pregunta

Estoy buscando crear un motor de búsqueda de texto completo para uno de mis proyectos. Tenemos un MySQL, Tokyo Tyrant y documentos de archivo que necesitan ser indexados.

Estoy mirando Sphinx en este momento, pero no puedo descubrir si puedo usarlo para indexar cada documento.

Sé que es posible dejar que Sphinx use MySQL, pero estoy mirando una forma de dejar que Sphinx se indexe y consulte Tokyo Tyrant, así como documentos de archivo de índice.

Podría ser Sphinx o Xapian u otro, pero no Java (Lucene está fuera) pero algo que se puede usar con PHP y ejecutar en Linux.

¿Alguna idea de un motor de búsqueda que pueda aceptar más que MySQL como fuente?

Gracias

¿Fue útil?

Solución

Puede enviar datos de cualquier fuente a Sphinx utilizando el xmlpipe2

Solo necesitaría escribir algún código (probablemente en PHP) para leer desde Tokyo Tyrant (no estoy seguro de qué es eso, así que está solo) y el sistema de archivos y lo empaqueta todo como XML. Luego, simplemente configure su fuente de Sphinx para ejecutar un comando que ejecute su código personalizado y Sphinx se encarga del resto.

Otros consejos

Si no tiene demasiados documentos y desea usar solo PHP, debe echar un vistazo a Zend_Search_Lucene :

Zend_search_lucene es un motor de búsqueda de texto de propósito general escrito completamente en PHP 5. Dado que almacena su índice en el sistema de archivos y no requiere un servidor de base de datos, puede agregar capacidades de búsqueda a casi cualquier sitio web dirigido por PHP.

Aún así, si está utilizando su propio servidor, probablemente pueda instalar un software, lo que significa que puede implementar Lucence/Solr de Sphinx, incluso si no están escritos en solo PHP, esta podría ser una solución más segura si necesita indexe mucho contenido.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top