Domanda

Dato che potrei avere un file ARFF che è scritto nel seguente modulo:

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
.

E dovevo correre questo per addestrare un classificatore di Bayes ingenuo su Weka.Come creerei un set di test in modo che questo classificatore addestrato sia in grado di fare previsioni?Grazie.

È stato utile?

Soluzione

Ci sono molti repository di dati in cui è possibile trovare esempi di posta spam e non spam (dalla vita reale).Quindi, prendi il corpo delle mail spam / non spam e crea un file ARFF simile come questo (ma questa volta testerà il file ARFF) con etichette appropriate (spam per gli organismi postali di spam e nonspam per i corpi di posta non spam).Con il tuo file ARFF di allenamento, otterrai un modello di classificatore.Salva quel modello.Quindi su Weka Explorer Classifica la scheda, selezionare il pulsante di opzione "Test Set" e selezionare il set di test (avrà le etichette però).Quindi caricare il modello di allenamento, fare clic con il tasto destro del mouse su di esso e quindi selezionare Rivalutare con il set di test.Hai finito.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top