Comment choisir un modèle pour cette courbe de validation croisée?

https://datascience.stackexchange.com/questions/62147

02-11-2019
|

Question

J'utilise GridSearchCV pour régler les hyperparamètres pour un modèle multiclasse de régression logistique.

J'ai lu sur Kaggle que vous devriez choisir l'hyperparamètre qui se traduit par l'écart le plus bas entre le score CV et le score de formation, mais dans ce cas, cela conduit à un score très faible.

Comment dois-je choisir la valeur C appropriée pour garantir la généralisabilité du modèle mais également des performances élevées du modèle en fonction de la courbe CV ci-dessous?

De ma compréhension, opter pour une faible divergence entre les deux scores garantit la capacité du modèle à être généralisé à des données invisibles. Mais d'un autre côté, je veux un score aussi élevé que possible sur les données invisibles.

Merci pour toute aide!

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange