Domanda

Mi chiedevo se esiste un'implementazione buona e pulita della programmazione orientata agli oggetti (OOP) del filtro bayesiano per lo spam e la classificazione del testo?Questo è solo a scopo di apprendimento.

È stato utile?

Soluzione

Lo consiglio vivamente Weka che è un Software di data mining open source scritto in Java:

Weka è una raccolta di algoritmi di apprendimento automatico per attività di data mining.Gli algoritmi possono essere applicati direttamente a un set di dati o richiamati dal proprio codice Java.Weka contiene strumenti per la pre-elaborazione, la classificazione, la regressione, il clustering, le regole di associazione e la visualizzazione dei dati.È inoltre adatto per lo sviluppo di nuovi schemi di apprendimento automatico.

Come accennato in precedenza, viene fornito con una serie di classificatori diversi come SVM, Vagliare, C4.5, Naive Bayes (ovviamente) e molti altri (vedi Documento API).Tieni presente che è noto che molti classificatori hanno prestazioni molto migliori di Naive Bayes nel campo del rilevamento dello spam o della classificazione del testo.

Inoltre Weka ti offre molto potente interfaccia grafica

Altri suggerimenti

Dai un'occhiata al capitolo 6 di Programmazione dell'intelligenza collettiva

Ecco un'implementazione del filtro bayesiano in C#: Un filtro antispam bayesiano ingenuo per C# (ospitato su CodeProject).

nBayes - un'altra implementazione C# ospitata su CodePlex

In francese, ma dovresti riuscire a trovare il link per il download :)Filtro bayesiano naive PHP

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top