¿Cuál es la diferencia en xgboost binary: logística y reg: logística
-
16-10-2019 - |
Pregunta
¿Cuál es la diferencia en R en xgboost entre binario: logística y reg: logística? ¿Es solo en la métrica de evaluación?
En caso afirmativo, ¿cómo se compara RMSE en la clasificación binaria con la tasa de error? ¿La relación entre las métricas es más o menos monotónica, la salida de la sintonización en una métrica no debería diferir significativamente entre esos dos enfoques?
Solución
No hay diferencia en el algoritmo, son lo mismo. Cuando usas reg:logistic
La métrica de evaluación predeterminada es rmse
, pero puedes cambiar este parámetro.
los error rate
y el rmse
puede diferir según la distribución de su salida, como el error rate
Utiliza un límite de $ 0.5 $ si tiene los valores de salida concentrados en $ 0 $ o $ 1 $, será mucho menor que rmse
, a pesar de que su métrica correlacionada, el modelo puede ser muy diferente, la aplicación dependerá de su problema.
Evaluar el rendimiento de los modelos de regresión logística es habitual para calcular AUC, logloss, precisión, pseudo-$ r^2 $ y algunos otros.