Puntuación de modelos estadísticos
-
26-12-2019 - |
Pregunta
Estoy ejecutando una regresión logística usando statsmodels
y estoy tratando de encontrar el puntaje de mi regresión.La documentación realmente no proporciona mucha información sobre el score
método diferente sklearn
lo que permite al usuario pasar un conjunto de datos de prueba con el valor y y los coeficientes de regresión, es decir lr.score(test_data, target)
.¿Qué y cómo debo pasar parámetros al statsmodels
¿La función de puntuación?Documentación: http://statsmodels.sourceforge.net/stable/generated/statsmodels.discrete.discrete_model.Logit.score.html#statsmodels.discrete.discrete_model.Logit.score
Solución
En estadística y econometría. score
generalmente se refiere a la derivada de la función de verosimilitud logarítmica.Esa es la definición utilizada en los modelos de estadísticas.
Las medidas de rendimiento de predicción para clasificación o regresión con variables dependientes binarias se han descuidado en gran medida en los modelos estadísticos.Una solicitud de extracción abierta está aquíhttps://github.com/statsmodels/statsmodels/issues/1577
statsmodels tiene medidas de rendimiento para variables dependientes continuas.
Otros consejos
Le pasas los parámetros del modelo, es decir.los coeficientes de los predictores.Sin embargo, ese método no hace lo que crees que hace:devuelve el puntuación vectorial para el modelo, no la precisión de sus predicciones (como el scikit-learn score
método).