Pergunta

Eu estou considerando o uso de Apache Solr para dados de indexação em um novo projeto. Os dados são feitas de diferentes tipos, independentes, o que significa que existem, por exemplo,

  • botanicals
  • animais
  • carros
  • computadores

para indexar. Deveria eu estar usando diferentes índices para cada um dos tipos ou faz mais sentido usar apenas um índice? Como é que usando vários índices afeta o desempenho? Ou há alguma outra possibilidade para conseguir isso?

Graças.

Foi útil?

Solução

Ambos são abordagens legítimas, mas há vantagens e desvantagens. Primeiro, quão grande é o seu conjunto de dados? Se for grande o suficiente para que você pode querer dividir isso em vários servidores, provavelmente faz sentido ter diferentes índices.

Em segundo lugar, o quão importante é o desempenho - indexando-lo todos juntos irá provavelmente resultar em um pior desempenho, mas o grau depende da quantidade de dados que existe e a complexidade das consultas pode obter.

Em terceiro lugar, você tem a necessidade de consulta para vários tipos de dados na mesma pesquisa? Se assim for, indexando tudo junto pode ser uma maneira conveniente para permitir isso. Tecnicamente isso poderia ser conseguido com índices separados, mas recebendo a maioria de resultados relevantes para a consulta poderia ser um desafio (não que ele já não estiver)

Em quarto lugar, um índice único com um único esquema e configuração pode simplificar a vida de quem será a implantação e manutenção do sistema.

Uma outra coisa a considerar é IDs - não a todos os diferentes objetos têm um identificador único em todos os tipos? Se não, você provavelmente terá que gerar este se você deseja indexar-los juntos.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top