Objektorientierte Bayes'sche Spam-Filterung?
-
08-06-2019 - |
Frage
Ich habe mich gefragt, ob es eine gute und saubere objektorientierte Programmierung (OOP)-Implementierung der Bayes'schen Filterung für Spam und Textklassifizierung gibt?Dies dient lediglich Lernzwecken.
Lösung
Ich kann es auf jeden Fall empfehlen Weka Das ist ein Open-Source-Data-Mining-Software geschrieben in Java:
Weka ist eine Sammlung maschineller Lernalgorithmen für Data-Mining-Aufgaben.Die Algorithmen können entweder direkt auf einen Datensatz angewendet oder aus Ihrem eigenen Java-Code aufgerufen werden.Weka enthält Tools zur Datenvorverarbeitung, Klassifizierung, Regression, Clustering, Assoziationsregeln und Visualisierung.Es eignet sich auch gut für die Entwicklung neuer maschineller Lernverfahren.
Wie oben erwähnt, wird es mit einer Reihe verschiedener Klassifikatoren geliefert, z SVM, Worfeln, C4.5, Naive Bayes (natürlich) und viele mehr (siehe API-Dokument).Beachten Sie, dass viele Klassifikatoren dafür bekannt sind viel bessere Leistung als Naive Bayes im Bereich Spam-Erkennung oder Textklassifizierung.
Darüber hinaus bietet Ihnen Weka eine sehr leistungsstarke GUI…
Andere Tipps
Schauen Sie sich Kapitel 6 an Kollektive Intelligenz programmieren
Vielleicht https://ci-bayes.dev.java.net/ oder http://www.cs.cmu.edu/~javabayes/Home/node2.html?
Ich habe auch nie damit gespielt.
Hier ist eine Implementierung der Bayes'schen Filterung in C#: Ein naiver Bayes'scher Spamfilter für C# (gehostet auf CodeProject).
nBayes – eine weitere C#-Implementierung, die auf CodePlex gehostet wird
Auf Französisch, aber Sie sollten den Download-Link finden können :)Naiver Bayesianischer PHP-Filter