Pergunta

No Lucene, se você tivesse vários índices que cobrissem apenas uma partição cada.Por que a mesma pesquisa em índices diferentes retorna resultados com pontuações diferentes?Os resultados de diferentes servidores correspondem exatamente.

ou sejase eu procurasse:

  • Nome - John Smith
  • Data de nascimento - 11/11/1934

Partição 0 retornaria uma pontuação de 0,345

Partição 1 retornaria uma pontuação de 0,337

Ambos correspondem exatamente no nome e data de nascimento.

Nenhuma solução correta

Outras dicas

O pontuação contém a frequência inversa do documento (IDF).Se o termo "John Smith" estiver em uma partição, 0,100 vezes e na partição 1, uma vez.A pontuação para a busca por John Smith seria maior na busca na partição 1, pois o termo é mais escasso.

Para contornar isso, você teria que ter seu índice em todas as partições ou precisaria substituir o IDF.

Porque a pontuação é determinada no índice, se não me engano.

Se você tiver índices diferentes (mais/menos ou dados diferentes que foram indexados), a pontuação será diferente:

http://lucene.apache.org/core/3_6_0/scoring.html

(Aviso:Contém matemática :-))

Você também pode estar interessado no resultado do explain() método, e o resultante Explanation objeto, o que lhe dará uma ideia de como as coisas são pontuadas da maneira que são.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top