Объектно-ориентированная байесовская фильтрация нежелательной почты?

StackOverflow https://stackoverflow.com/questions/1083

Вопрос

Мне было интересно, существует ли какая-нибудь хорошая и чистая реализация байесовской фильтрации спама и классификации текста в объектно-ориентированном программировании (ООП)?Это просто в учебных целях.

Это было полезно?

Решение

Я определенно рекомендую Веска который является Программное обеспечение для интеллектуального анализа данных с открытым исходным кодом написан на Java:

Weka - это набор алгоритмов машинного обучения для задач интеллектуального анализа данных.Алгоритмы могут быть либо применены непосредственно к набору данных, либо вызваны из вашего собственного Java-кода.Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации.Он также хорошо подходит для разработки новых схем машинного обучения.

Как упоминалось выше, он поставляется с кучей различных классификаторов, таких как SVM, Отсеивать, С4.5, Наивный Байес (конечно) и многие другие (см. Документ по API).Обратите внимание, что известно, что многие классификаторы имеют гораздо лучшая производительность, чем у Наивного Байеса в области обнаружения спама или классификации текста.

Кроме того, Weka предлагает вам очень мощный графический интерфейс

Другие советы

Ознакомьтесь с главой 6 из Программирование Коллективного разума

Может быть https://ci-bayes.dev.java.net/ или http://www.cs.cmu.edu /~javabayes/Home/node2.html?

Я тоже никогда с ним не играл.

Вот реализация байесовской фильтрации на C#: Наивный байесовский спам-фильтр для C# (размещен на CodeProject).

нБайес - еще одна реализация C #, размещенная на CodePlex

На французском, но вы должны быть в состоянии найти ссылку для скачивания :) Наивный байесовский фильтр PHP

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top