Frage

Wir versuchen, einen semantischen Suchalgorithmus umzusetzen, um vorgeschlagene Kategorien basierend auf den Suchbegriffen eines Benutzers anzugeben.

Im Moment haben wir den Naive Bayes-probabilistischen Algorithmus implementiert, um die Wahrscheinlichkeiten jeder Kategorie in unseren Daten zurückzugeben und dann den höchsten zurückzugeben.

Aufgrund seiner Naivität erhält man manchmal die Ergebnisse falsch.

, ohne in neuronale Netze zu gehen, und andere lächerlich komplexe Sachen gibt es eine andere Alternative, in die wir einsehen können?

War es hilfreich?

Lösung

naive Bayes (NB) ist nicht viel anders als logistische Regression.Aus Erfahrung, logistischer Regression übertreibt die meiste Zeit nb in Bezug auf die vorausschauende Leistung.

auch, wenn Sie genügend Daten haben und keine fehlenden Daten haben, werden Sie höchstwahrscheinlich feststellen, dass die vorhersehende Leistung von NB so ziemlich wie die komplizierteren Methoden wie Bayesian Networks (BNS) ist, wasNehmen Sie nicht die "naive" Unabhängigkeitsübernahme zwischen den Covariates.

Wenn Sie die Unabhängigkeitsannahme entspannen möchten, ohne vollständig in das Reich von BNS tauchen zu müssen, können Sie das Baum Augmented Naive Bayes Algorithmus zuerst.

Andere Tipps

Wenn Sie lineare SVM nicht in Betracht ziehen, um lächerlich komplexe Sachen zu sein , könnten Sie das versuchen.Es ist bekannt, für solche Aufgaben sehr gut auszuführen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top