Pregunta

Dado que puedo tener un archivo ARFF que está escrito en el siguiente formulario:

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam

y yo debíamos correr esto para entrenar un clasificador de Bayes ingenuo en Weka.¿Cómo crearía un conjunto de pruebas para que este clasificador capacitado pueda hacer predicciones?Gracias.

¿Fue útil?

Solución

Hay muchos repositorios de datos donde puede encontrar ejemplos de correo no spam y no spam (de la vida real).Luego, tome el cuerpo de los correos de spam / no spam y haga un archivo ARFF similar como este (pero esta vez estará probando el archivo ARFF) con las etiquetas apropiadas (SPAM para los cuerpos de correo de spam y NotSpam para los cuerpos de correo no spam.).Con su archivo de entrenamiento ARFF, obtendrá un modelo de clasificador.Guarda ese modelo.Luego, en Weka Explorer Classify Tab, seleccione el botón de radio "Conjunto de prueba" y seleccione su conjunto de prueba (aunque tendrá las etiquetas).Luego, cargue su modelo de entrenamiento, haga clic con el botón derecho en él y luego seleccione Reevaluar con el conjunto de pruebas.Estas terminado

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top