Domanda

Ho in programma di implementare filtro anti-spam utilizzando Naive modello di classificazione bayesiana.

Online vedo un sacco di informazioni su Naive classificazione bayesiana, ma il problema è che è un sacco di roba matematica, che indicando chiaramente come il suo fare. E il problema è che io sono più di un programmatore di un matematico (sì avevo imparato Probabilità e Bayesiano teorema tornati a scuola, ma in contatto per lungo tempo, e non ho lusso di imparare subito (Hanno quasi 3 settimane a venire-up con un prototipo funzionante)).

Quindi, se qualcuno può spiegare o punto me posizione in cui la sua spiegato per i programmatori di un matematico, sarebbe di grande aiuto.

PS: A proposito devo implementare in C, se si vuole sapere. : (

Saluti, Microkernel

È stato utile?

Soluzione

Il libro Programmazione Intelligenza Collettiva ha capitolo che copre questo ed altri metodi. Il capitolo (# 6) può essere compreso senza fare riferimento ai capitoli precedenti, è scritto in modo chiaro, e discute solo la matematica minime necessarie per ottenere il lavoro fatto.

Altri suggerimenti

Si potrebbe provare questo sito . Essa ha avuto un po 'di codice sorgente.

consiglio vivamente tutorial Andrew Moore e penso che si dovrebbe iniziare con questo .

Si potrebbe anche dare un'occhiata a POPFile , un motore di filtro antispam open source.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top