Pregunta

Estamos tratando de implementar un algoritmo de búsqueda semántica para dar categorías sugeridas según los términos de búsqueda de un usuario.

En este momento hemos implementado el algoritmo probabilístico de Bayes ingenuos para devolver las probabilidades de cada categoría en nuestros datos y luego devolver la más alta.

Sin embargo, debido a su ingenuidad a veces obtiene los resultados incorrectos.

Sin entrar en redes neuronales y otras cosas ridículamente complejas ¿Hay otra alternativa que podemos investigar?

¿Fue útil?

Solución

NAIVE BAYES (NB) no es muy diferente a la regresión logística.Desde la experiencia, la regresión logística supera el NB en términos de desempeño predictivo la mayor parte del tiempo.

Además, si tiene suficientes datos y no tiene datos faltantes, lo más probable es que encuentre que el rendimiento predictivo de NB es casi lo mismo que las metodologías más complicadas, como las redes bayesianas (BNS), queNo tenga el supuesto 'ingenuo' de la independencia entre covariates.

Si desea relajar el supuesto de la independencia sin tener que bucear plenamente en el ámbito de BNS, puede probar el Árbol aumentó NAIVE BAYES PRIMERO ALGORITHM.

Otros consejos

Si no considera que SVM lineal es cosas ridículamente complejas , podrías intentarlo.Se sabe que se desempeña muy bien para tales tareas.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top