Pergunta

Eu estou usando o recurso de explorador de Weka para a classificação.

Então, eu tenho o meu arquivo .arff, com 2 características de valor numérico, e minha classe é um binário 0 ou 1 (por exemplo, {0,1}).

Amostra:

@RELATION summary
@ATTRIBUTE feature1 NUMERIC
@ATTRIBUTE feature2 NUMERIC
@ATTRIBUTE class {1,0}

@DATA
23,11,0
20,100,1
2,36,0
98,8,1
.....

eu carregar este arquivo .arff, uso 10 vezes validação cruzada (nenhum arquivo de teste), e escolha NaiveBayes, então eu classificar os dados, e isso me dá: 5 rotulada incorretamente, 100 rotulado corretamente. Até aqui tudo bem.

Agora, eu mudar significativamente o meu arquivo .arff (dar valores completamente aleatórios para meus atributos de recurso). E repetir o procedimento acima, e eu recebo exatamente o mesmo estatísticas ao classificar.

Eu tentei isso com mais alterações no meu arquivo .arff, diferentes algoritmos de classificação. Ainda assim, exatamente a mesma estatística (dentro do mesmo algoritmo) não importa o que valoriza eu dou a minha .arff arquivo.

Estou fazendo algo errado aqui?

Foi útil?

Solução

É difícil dizer sem mais informações, mas eu tenho duas sugestões:

  1. Quais são as proporções relativas das duas classes? É 5-100? Lotes de algoritmos não funcionam bem com distribuições de etiquetas classe altamente enviesada.

  2. Apenas um palpite, mas tente mudar as etiquetas de classe a partir de números de cordas (por exemplo, 'class1' e 'class2'). Weka chama estes 'nominal' atributos talvez por isso o uso de números não é permitido.

Outras dicas

Além disso: manter em mente que a validação cruzada é bastante horrível na interface do usuário como eles só mostrar-lhe a árvore original, de qualquer forma (antes de dobrar em outros dados). Se você quiser as árvores finais gerado, você precisa da API programática. Eu sugiro usar um conjunto de dados de treinamento de divisão / teste.

Você já tentou mudar

@ATTRIBUTE class {1,0} 

com

@ATTRIBUTE class {yes,no} 
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top