Come funziona il lavoro in class_weights RandomForestClassifier
-
16-10-2019 - |
Domanda
Sono di fronte a un problema con le classi sbilanciate, ed ho provato un paio di metodi come sopra e sotto campionamento. Tuttavia, la mia croce medio di validazione risulta essere solo 0,4 e mia confusione spettacoli matrice che la previsione e il richiamo è completamente corretto.
Ho letto che il prossimo passo è quello di aggiungere pesi per la mia classe; Ho due di loro "Won" e "Lost". In Panda, come faccio ad assegnare pesi a loro? So che c'è un attributo "class_weights", ma non ho idea su come usarlo.
Grazie
PS. La mia classe "Won" è sbilanciato, molto piccolo rispetto a quello "Lost". Addestro ripetendo set di "Won" s due volte e assaggiare casualmente una quantità quasi uguale di s "Lost". Ho provato tutti i tipi di combinazioni delle classi.
Soluzione
Forse cercare di codificare i valori di riferimento in formato binario. Poi, questo class_weight={0:1,1:2}
dovrebbe fare il lavoro. Ora, classe 0 ha peso 1 e la classe 1 ha un peso 2.