Наивный байесовский спам-фильтр-фильтр
-
26-09-2019 - |
Вопрос
Я планирую реализовать спам-фильтр с использованием наивной модели байесовской классификации.
Онлайн я вижу много информации о наивной байесианской классификации, но проблема в том, что это много математических вещей, чем четко указано, насколько это сделано. И проблема в том, что я больше программист, чем математик (Да, я научил вероятность и байесовскую теорему обратно в школу, но в течение долгого времени, но у меня нет роскоши изучения сейчас (имейте почти 3 недели, чтобы придумать рабочий прототип)).
Поэтому, если кто-то может объяснить или указать мне на место, где его объяснил программистам, чем математика, это было бы большую помощь.
PS: Кстати, я должен реализовать его в C, если вы хотите знать. :(
С уважением, Microkernel.
Решение
Книга Программирование коллективного интеллекта имеет главу, которая охватывает это и другие методы. Глава (№ 6) можно понять без ссылки на предыдущие главы, написано четко, и обсуждается только минимальная математика, необходимая для выполнения работы.
Другие советы
Вы можете попробовать это Веб-сайт. Отказ У него есть какой-то исходный код.
Я очень рекомендую Учебники Эндрю Мура И я думаю, что вы должны начать с Вот этот.
Вы также можете взглянуть на Попфиль, двигатель фильтра спама с открытым исходным кодом.