Domanda

Stiamo cercando di implementare un algoritmo semantico di ricerca per fornire categorie suggerite in base ai termini di ricerca di un utente.

Al momento abbiamo implementato l'algoritmo probabilistico di Naive Bayes per restituire le probabilità di ciascuna categoria nei nostri dati e quindi restituire quella più alta.

Tuttavia, a causa della sua ingenuità, a volte ottiene i risultati errati.

Senza entrare in reti neurali e altre roba ridicolmente complesse c'è un'altra alternativa che possiamo guardare?

È stato utile?

Soluzione

Naive Bayes (NB) non è molto diversa dalla regressione logistica.Dall'esperienza, la regressione logistica sovraperforma NB in termini di prestazioni predittive la maggior parte del tempo.

Inoltre, se si dispone di dati sufficienti e non hanno dati mancanti, probabilmente troverai che le prestazioni predittive di NB sono praticamente le stesse delle metodologie più complicate, come le reti bayesiane (BNS), cheNon avere l'assunzione di indipendenza "ingenua" tra i covariati.

Se vuoi rilassare l'ipotesi di indipendenza senza dover immergersi completamente nel regno del BNS, puoi provare il alberi aumentato naive bayes algoritmo prima.

Altri suggerimenti

Se non si considera che Svm lineare sia roba ridicolmente complessa , potresti provarlo.È noto per svolgere molto bene per tali compiti.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top