Вопрос

Учитывая, что у меня может быть файл ARFF, который написан в следующей форме:

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
.

И я должен был запустить это, чтобы тренировать наивный байс классификатор на Weka.Как бы я создал тестовый набор, чтобы этот подготовленный классификатор сможет сделать прогнозы?Спасибо.

Это было полезно?

Решение

Есть много репозиториев данных, где вы можете найти спам и не спам-почтовые примеры (от реальной жизни).Затем возьмите тело спама / не спам-почты и сделайте аналогичный файл ARFF, например, этот (но на этот раз он будет тестировать файл ARFF) с соответствующими метками (спам для спам-почтовых органов и Notspam для не-спам-почтовых органов).С вашей подготовкой ARFF-файлом вы получите модель классификатора.Сохранить эту модель.Затем на вкладке Weka Explorer Closeify выберите «Набор тестов», и выберите свой тестовый набор (хотя у него будут этикетки).Затем загрузите модель обучения, щелкните правой кнопкой мыши, а затем выберите «Переоценить» с помощью тестового набора.Вы сделали.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top