Наивный байесовский спам-фильтр-фильтр

https://stackoverflow.com/questions/2617976

26-09-2019
|

Вопрос

Я планирую реализовать спам-фильтр с использованием наивной модели байесовской классификации.

Онлайн я вижу много информации о наивной байесианской классификации, но проблема в том, что это много математических вещей, чем четко указано, насколько это сделано. И проблема в том, что я больше программист, чем математик (Да, я научил вероятность и байесовскую теорему обратно в школу, но в течение долгого времени, но у меня нет роскоши изучения сейчас (имейте почти 3 недели, чтобы придумать рабочий прототип)).

Поэтому, если кто-то может объяснить или указать мне на место, где его объяснил программистам, чем математика, это было бы большую помощь.

PS: Кстати, я должен реализовать его в C, если вы хотите знать. :(

С уважением, Microkernel.

Решение

Книга Программирование коллективного интеллекта имеет главу, которая охватывает это и другие методы. Глава (№ 6) можно понять без ссылки на предыдущие главы, написано четко, и обсуждается только минимальная математика, необходимая для выполнения работы.

Другие советы

Вы можете попробовать это Веб-сайт. Отказ У него есть какой-то исходный код.

Я очень рекомендую Учебники Эндрю Мура И я думаю, что вы должны начать с Вот этот.

Вы также можете взглянуть на Попфиль, двигатель фильтра спама с открытым исходным кодом.

Вы смотрели на Dspam?

http://dspam.irotc.com/faq.shtml#1.0

http://www.nuclealephant.com/

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow