Pregunta

Yo era un gran consumidor de Sphinx y Lucene. Sphinx sólo se necesita una base de datos, índices de TI. Y se llama a Sphinx para obtener la ID.

Pero lo que si quiero crear un motor de búsqueda que es muy pequeño . A sólo un par de filas de datos y algunos párrafos de las palabras? El truco es, las filas de datos está en constante cambio. Por lo tanto, no puedo tener un "índice".

Quiero ser capaz de clasificar por relevancia, al igual que la esfinge. ¿Cómo puedo hacer eso? Por supuesto, yo no iría a través de la indexación ...

¿Fue útil?

Solución

Si sólo tiene un par de filas de datos y algunos párrafos de palabras en cada uno, mantener todo en la memoria y utilizar cualquier algoritmo de texto que tiene más sentido para su contenido.

Otros consejos

  

Por supuesto, yo no iría a través de la indexación ...

¿Cómo se va a determinar la relevancia sin mirar a todo?

Si sólo hay un poquito de los datos, y está cambiando tanto que mantiene un índice es poco práctica, en su lugar podría generar el índice cada vez que desee buscar los datos, realizar consultas, y luego quitar el índice la próxima vez los cambios en los datos. Con un conjunto pequeño de datos, actualizaciones frecuentes y poco frecuentes operaciones de búsqueda, esto podría ser más eficiente que el mantenimiento del índice.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top