Pergunta
No Lucene, se você tivesse vários índices que cobrissem apenas uma partição cada.Por que a mesma pesquisa em índices diferentes retorna resultados com pontuações diferentes?Os resultados de diferentes servidores correspondem exatamente.
ou sejase eu procurasse:
- Nome - John Smith
- Data de nascimento - 11/11/1934
Partição 0 retornaria uma pontuação de 0,345
Partição 1 retornaria uma pontuação de 0,337
Ambos correspondem exatamente no nome e data de nascimento.
Nenhuma solução correta
Outras dicas
O pontuação contém a frequência inversa do documento (IDF).Se o termo "John Smith" estiver em uma partição, 0,100 vezes e na partição 1, uma vez.A pontuação para a busca por John Smith seria maior na busca na partição 1, pois o termo é mais escasso.
Para contornar isso, você teria que ter seu índice em todas as partições ou precisaria substituir o IDF.
Porque a pontuação é determinada no índice, se não me engano.
Se você tiver índices diferentes (mais/menos ou dados diferentes que foram indexados), a pontuação será diferente:
http://lucene.apache.org/core/3_6_0/scoring.html
(Aviso:Contém matemática :-))
Você também pode estar interessado no resultado do explain()
método, e o resultante Explanation
objeto, o que lhe dará uma ideia de como as coisas são pontuadas da maneira que são.