Question

étant donné que je peux avoir un fichier arff écrit dans le formulaire suivant:

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam

Et je devais courir cela pour former un classificateur naïf bayes sur Weka.Comment créerai-je un ensemble de test afin que ce classificateur formé puisse faire des prédictions?Merci.

Était-ce utile?

La solution

Il existe de nombreux référentiels de données dans lesquels vous pouvez trouver des exemples de courrier indésirable et de messagerie anti-spam (de la vie réelle).Ensuite, prenez le corps des courriers spam / non-spam et faites un fichier arff similaire comme celui-ci (mais cette fois, il testera le fichier ARFF) avec des étiquettes appropriées (spam for Spam Mail Corps et NotSpam pour les organismes de messagerie non spam.).Avec votre fichier ARFF de formation, vous obtiendrez un modèle de classificateur.Enregistrer ce modèle.Ensuite, sur l'onglet Weka Explorer Classify, sélectionnez le bouton radio "Set de test" et sélectionnez votre ensemble de test (il aura les étiquettes).Ensuite, chargez votre modèle d'entraînement, cliquez avec le bouton droit de la souris, puis sélectionnez Réévaluez avec le jeu de tests.Vous avez terminé.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top