Frage

Wenn Sie in Lucene mehrere Indizes hatten, die jeweils nur eine Partition abdeckten.Warum liefert dieselbe Suche in verschiedenen Indizes Ergebnisse mit unterschiedlichen Bewertungen?Die Ergebnisse verschiedener Server stimmen genau überein.

d.h.wenn ich gesucht hätte nach:

  • Name: John Smith
  • Geburtsdatum: 11.11.1934

Partition 0 würde einen Wert von 0,345 zurückgeben

Partition 1 würde einen Wert von 0,337 ergeben

Beide stimmen hinsichtlich Name und Geburtsdatum genau überein.

Keine korrekte Lösung

Andere Tipps

Der punkten enthält die Inverse Document Frequency (IDF).Wenn der Begriff „John Smith“ in einer Partition 0, 100 Mal und in Partition 1 einmal vorkommt.Die Punktzahl für die Suche nach „John Smith“ wäre eine höhere Suche in Partition 1, da der Begriff seltener vorkommt.

Um dies zu umgehen, müsste Ihr Index alle Partitionen umfassen oder Sie müssten die IDF überschreiben.

Denn die Punktzahl wird über den Index ermittelt, wenn ich mich nicht völlig irre.

Wenn Sie unterschiedliche Indizes haben (mehr/weniger oder unterschiedliche Daten, die indiziert wurden), unterscheidet sich die Bewertung:

http://lucene.apache.org/core/3_6_0/scoring.html

(Warnung:Enthält Mathematik :-))

Möglicherweise interessiert Sie auch die Ausgabe des explain() Methode, und das Ergebnis Explanation Objekt, was Ihnen eine Vorstellung davon gibt, wie die Dinge so bewertet werden, wie sie sind.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top