Filtraggio antispam bayesiano orientato agli oggetti?
-
08-06-2019 - |
Domanda
Mi chiedevo se esiste un'implementazione buona e pulita della programmazione orientata agli oggetti (OOP) del filtro bayesiano per lo spam e la classificazione del testo?Questo è solo a scopo di apprendimento.
Soluzione
Lo consiglio vivamente Weka che è un Software di data mining open source scritto in Java:
Weka è una raccolta di algoritmi di apprendimento automatico per attività di data mining.Gli algoritmi possono essere applicati direttamente a un set di dati o richiamati dal proprio codice Java.Weka contiene strumenti per la pre-elaborazione, la classificazione, la regressione, il clustering, le regole di associazione e la visualizzazione dei dati.È inoltre adatto per lo sviluppo di nuovi schemi di apprendimento automatico.
Come accennato in precedenza, viene fornito con una serie di classificatori diversi come SVM, Vagliare, C4.5, Naive Bayes (ovviamente) e molti altri (vedi Documento API).Tieni presente che è noto che molti classificatori hanno prestazioni molto migliori di Naive Bayes nel campo del rilevamento dello spam o della classificazione del testo.
Inoltre Weka ti offre molto potente interfaccia grafica…
Altri suggerimenti
Dai un'occhiata al capitolo 6 di Programmazione dell'intelligenza collettiva
Forse https://ci-bayes.dev.java.net/ O http://www.cs.cmu.edu/~javabayes/Home/node2.html?
Nemmeno io ci ho mai giocato.
Ecco un'implementazione del filtro bayesiano in C#: Un filtro antispam bayesiano ingenuo per C# (ospitato su CodeProject).
nBayes - un'altra implementazione C# ospitata su CodePlex
In francese, ma dovresti riuscire a trovare il link per il download :)Filtro bayesiano naive PHP