Domanda

Sto usando GridSearchcv per sintonizzare iperparametri per un modello multiclass di regressione logistica.

Ho letto su Kaggle che dovresti scegliere l'iperparametro che si traduce nella più bassa discrepanza tra il punteggio CV e il punteggio di allenamento, ma in questo caso questo porta a un punteggio molto basso.

Come dovrei scegliere il valore C corretto per garantire la generalizzabilità del modello ma anche le prestazioni del modello elevate in base alla curva CV di seguito?

enter image description here

Dalla mia comprensione optare per una bassa discrepenza tra i due punteggi garantisce la capacità del modello di essere generalizzata a dati invisibili. D'altra parte, voglio un punteggio il più alto possibile su dati invisibili.

Grazie per qualsiasi aiuto!

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top