ingenuo bayesiano domanda filtro anti-spam

https://stackoverflow.com/questions/2617976

26-09-2019
|

Domanda

Ho in programma di implementare filtro anti-spam utilizzando Naive modello di classificazione bayesiana.

Online vedo un sacco di informazioni su Naive classificazione bayesiana, ma il problema è che è un sacco di roba matematica, che indicando chiaramente come il suo fare. E il problema è che io sono più di un programmatore di un matematico (sì avevo imparato Probabilità e Bayesiano teorema tornati a scuola, ma in contatto per lungo tempo, e non ho lusso di imparare subito (Hanno quasi 3 settimane a venire-up con un prototipo funzionante)).

Quindi, se qualcuno può spiegare o punto me posizione in cui la sua spiegato per i programmatori di un matematico, sarebbe di grande aiuto.

PS: A proposito devo implementare in C, se si vuole sapere. : (

Saluti, Microkernel

Soluzione

Il libro Programmazione Intelligenza Collettiva ha capitolo che copre questo ed altri metodi. Il capitolo (# 6) può essere compreso senza fare riferimento ai capitoli precedenti, è scritto in modo chiaro, e discute solo la matematica minime necessarie per ottenere il lavoro fatto.

Altri suggerimenti

Si potrebbe provare questo sito . Essa ha avuto un po 'di codice sorgente.

consiglio vivamente tutorial Andrew Moore e penso che si dovrebbe iniziare con questo .

Si potrebbe anche dare un'occhiata a POPFile , un motore di filtro antispam open source.

Hai guardato DSPAM?

http://dspam.irontec.com/faq.shtml#1.0

http://www.nuclearelephant.com/

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow