Pregunta

Estoy considerando el uso de Apache solr para indexar datos en un nuevo proyecto. Los datos están hechos de diferentes tipos independientes, lo que significa que hay, por ejemplo,

  • botanicals
  • animales
  • coches
  • computadoras

para indexar. ¿Debo usar índices diferentes para cada uno de los tipos o tiene más sentido usar solo un índice? ¿Cómo afecta el rendimiento el uso de muchos índices? ¿O hay alguna otra posibilidad para lograr esto?

Gracias.

¿Fue útil?

Solución

Ambos son enfoques legítimos, pero hay compensaciones. Primero, ¿qué tan grande es tu conjunto de datos? Si es lo suficientemente grande como para que desee dividirlo en varios servidores, probablemente tenga sentido tener índices diferentes.

En segundo lugar, lo importante que es el rendimiento: indexarlo todo de forma conjunta resultará en un peor rendimiento, pero el grado depende de la cantidad de datos que haya y la complejidad de las consultas.

Tercero, ¿tiene la necesidad de consultar varios tipos de datos en la misma búsqueda? Si es así, indexar todo junto puede ser una forma conveniente de permitir esto. Técnicamente, esto podría lograrse con índices separados, pero obtener los resultados más relevantes para la consulta podría ser un desafío (no es que todavía no lo haya)

Cuarto, un índice único con un solo esquema y configuración puede simplificar la vida de quien esté implementando y manteniendo el sistema.

Otra cosa a considerar es la ID: ¿todos los diferentes objetos tienen un identificador único en todos los tipos? Si no es así, probablemente deba generar esto si desea indexarlos juntos.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top