Pregunta

Estoy pensando en usar ask sphinx para indexar muchos campos (en cientos), muchos de los cuales serán nulos. Mi pregunta es ¿cuánto afectará el rendimiento tener muchos campos nulos?

Esta situación surge no por tener datos increíblemente desnormalizados, sino por los requisitos en la interfaz de búsqueda y lo que se puede buscar. Básicamente, estaré construyendo la configuración del índice dinámicamente en el modelo indexado, y podría terminar con bastantes campos nulos para hacerlo.

Supongo que el rendimiento / éxito de esto depende de lo que Sphinx haga con valores nulos ... si simplemente los ignora, entonces debería estar bien, pero si realmente almacena que el campo es nulo en su índice, yo podría tener un problema.

¿Fue útil?

Solución

Aparentemente, la versión actual de Sphinx limita a 32 campos de texto por índice (numérico ilimitado), por lo que tendría que dividir los datos en varios índices diferentes para lograr esto, a menos que todos los datos puedan representarse numéricamente (lo que el mío no puede). De vuelta al tablero de dibujo!

Otros consejos

Un gran número de campos nulos no afectará demasiado el rendimiento. Problema principal con muchos campos nulos de que comerán una buena porción de memoria.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top