Pergunta

Dado que posso ter um arquivo ARFF escrito no seguinte formato:

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam

E eu deveria executar isso para treinar um classificador Naive Bayes em Weka.Como eu criaria um conjunto de testes para que esse classificador treinado pudesse fazer previsões?Obrigado.

Foi útil?

Solução

Existem muitos repositórios de dados onde você pode encontrar exemplos de mensagens de spam e não spam (da vida real).Em seguida, pegue o corpo dos e-mails de spam/não-spam e crie um arquivo arff semelhante como este (mas desta vez será um arquivo arff de teste) com rótulos apropriados (spam para corpos de e-mail de spam e notspam para corpos de e-mail não-spam ).Com seu arquivo arff de treinamento, você obterá um modelo de classificador.Salve esse modelo.Em seguida, na guia de classificação do Weka Explorer, selecione o botão de opção "conjunto de teste" e selecione seu conjunto de teste (no entanto, ele terá os rótulos).Em seguida, carregue seu modelo de treinamento, clique com o botão direito nele e selecione reavaliar com conjunto de testes.Você terminou.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top