Domanda

Qual è la differenza di R in xgboost tra binario: logistica e reg: logistica? E 'solo nella valutazione metrica?

Se sì, in che modo RMSE sulla classificazione binaria confronta con tasso di errore? È il rapporto tra le metriche più o meno monotona, uscita dalla sintonizzazione su una metrica non dovrebbe differire in modo significativo tra questi due approcci?

È stato utile?

Soluzione

Non c'è differenza nell'algoritmo, sono la stessa cosa. Quando si utilizza reg:logistic la metrica di valutazione di default è rmse, ma è possibile modificare questo parametro.

Il error rate ed il rmse possono variare a seconda della distribuzione del vostro output, come il error rate utilizza un limite di $ 0,5 $ se si hanno i valori di uscita concentrati in $ 0 $ o $ 1 $ sarà molto più piccola di rmse, anche se la sua correlata metrica il modello può essere molto diverso, l'applicazione dipenderà dal vostro problema.

Per valutare le prestazioni dei modelli di regressione logistica è soliti calcolare AUC, logloss, accuratezza, pseudo $ R ^ 2 $ e alcuni altri .

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top