Frage

Ich habe mich gefragt, ob es eine gute und saubere objektorientierte Programmierung (OOP)-Implementierung der Bayes'schen Filterung für Spam und Textklassifizierung gibt?Dies dient lediglich Lernzwecken.

War es hilfreich?

Lösung

Ich kann es auf jeden Fall empfehlen Weka Das ist ein Open-Source-Data-Mining-Software geschrieben in Java:

Weka ist eine Sammlung maschineller Lernalgorithmen für Data-Mining-Aufgaben.Die Algorithmen können entweder direkt auf einen Datensatz angewendet oder aus Ihrem eigenen Java-Code aufgerufen werden.Weka enthält Tools zur Datenvorverarbeitung, Klassifizierung, Regression, Clustering, Assoziationsregeln und Visualisierung.Es eignet sich auch gut für die Entwicklung neuer maschineller Lernverfahren.

Wie oben erwähnt, wird es mit einer Reihe verschiedener Klassifikatoren geliefert, z SVM, Worfeln, C4.5, Naive Bayes (natürlich) und viele mehr (siehe API-Dokument).Beachten Sie, dass viele Klassifikatoren dafür bekannt sind viel bessere Leistung als Naive Bayes im Bereich Spam-Erkennung oder Textklassifizierung.

Darüber hinaus bietet Ihnen Weka eine sehr leistungsstarke GUI

Andere Tipps

Schauen Sie sich Kapitel 6 an Kollektive Intelligenz programmieren

Vielleicht https://ci-bayes.dev.java.net/ oder http://www.cs.cmu.edu/~javabayes/Home/node2.html?

Ich habe auch nie damit gespielt.

Hier ist eine Implementierung der Bayes'schen Filterung in C#: Ein naiver Bayes'scher Spamfilter für C# (gehostet auf CodeProject).

nBayes – eine weitere C#-Implementierung, die auf CodePlex gehostet wird

Auf Französisch, aber Sie sollten den Download-Link finden können :)Naiver Bayesianischer PHP-Filter

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top