Pregunta

Tengo la intención de aplicar el filtro de spam utilizando modelo de clasificación bayesiano Naive.

En línea Veo una gran cantidad de información sobre la clasificación bayesiano ingenuo, pero el problema es que es un montón de cosas matemática, que indica claramente cómo se hace. Y el problema es que estoy más de un programador que un matemático (sí que había aprendido Probabilidad y volver teorema bayesiano en la escuela, pero fuera de contacto durante mucho, mucho tiempo, y no tengo el lujo de aprenderlo ahora (Tienen casi 3 semanas por venir arriba con un prototipo de trabajo)).

Así que si alguien puede explicar o que me señale a la ubicación donde su explicó para los programadores que un matemático, sería una gran ayuda.

PD: Por cierto que tengo que ponerlo en práctica en C, si usted quiere saber. : (

Saludos, Microkernel

¿Fue útil?

Solución

El libro Programación de Inteligencia Colectiva tiene capítulo que trata este y otros métodos. El capítulo (# 6) puede ser entendido sin referencia a los capítulos anteriores, está escrito con claridad, y se analizan sólo las matemáticas mínimas necesarias para realizar el trabajo.

Otros consejos

página web . Tiene algo de código fuente.

Yo recomendaría altamente tutoriales Andrew Moore y yo creo que se debe comenzar con éste .

También puede echar un vistazo a POPFile , un motor de filtro de spam de código abierto.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top