Domanda

  1. voglio provare K-Fold cross validation in R per C5.0 algoritmo,

Il seguente è il codice che uso. Qualcuno mi può suggerire come posso includere k-fold così?

Classifi_C5.0 <-. C5.0 (TARGET ~,, data = training_data_SMOTED, sentieri = 500, Controllo = C5.0Control (minCases = mincases_count, noGlobalPruning = FALSE))

  1. E 'necessario per k volte la convalida incrociata per le foreste a caso?
È stato utile?

Soluzione

Direi convalida croce è inutile qui dal momento che la partizione multipla dei dati e delle variabili è già implicita in foreste casuali. Ma è ancora una buona pratica per tenere fuori una serie di test che è distinto dal training set. Questo è soprattutto perché si può introdurre cambiamenti nella vostra foresta casuale per migliorare le prestazioni sul set di prova generale, introducendo così il pregiudizio che le foreste casuali stanno cercando di superare. Quindi, se trattenuto una parte dei vostri dati e giudicato la performance finale del RF su quel set trattenuto solo nel prevedere passo, allora va bene.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top