Question

Je suis nouveau dans l'apprentissage en profondeur. Je travaille sur la formation d'un modèle SSD sur un ensemble de petits objets. J'utilise une descente de gradient Adam pour l'optimisation et une grande entrée (800x800), mais je semble n'obtenir qu'une amélioration de 0,010 après 20 époques environ (350 étapes).

Que puis-je faire ou rechercher pour accélérer la convergence sur ce modèle?

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
scroll top