¿Cuál es la diferencia en xgboost binary: logística y reg: logística

https://datascience.stackexchange.com/questions/9802

16-10-2019
|

Pregunta

¿Cuál es la diferencia en R en xgboost entre binario: logística y reg: logística? ¿Es solo en la métrica de evaluación?

En caso afirmativo, ¿cómo se compara RMSE en la clasificación binaria con la tasa de error? ¿La relación entre las métricas es más o menos monotónica, la salida de la sintonización en una métrica no debería diferir significativamente entre esos dos enfoques?

Solución

No hay diferencia en el algoritmo, son lo mismo. Cuando usas reg:logistic La métrica de evaluación predeterminada es rmse, pero puedes cambiar este parámetro.

los error rate y el rmse puede diferir según la distribución de su salida, como el error rate Utiliza un límite de $ 0.5 $ si tiene los valores de salida concentrados en $ 0 $ o $ 1 $, será mucho menor que rmse, a pesar de que su métrica correlacionada, el modelo puede ser muy diferente, la aplicación dependerá de su problema.

Evaluar el rendimiento de los modelos de regresión logística es habitual para calcular AUC, logloss, precisión, pseudo-$ r^2 $ y algunos otros.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a datascience.stackexchange