Pipeline recommandée d'augmentation des données
-
31-10-2019 - |
Question
Je souhaite effectuer une classification d'images à l'aide de keras et un ensemble de données composé de 50 classes. Pour le moment, je n'ai que 7 images par classe et j'ai besoin d'effectuer une augmentation des données afin de former le modèle et d'obtenir des valeurs de précision acceptables.
J'utilise le ImageDataGenerator
classe de kéras qui est recommandé pour l'augmentation de l'image à la volée (pendant la formation). Étant donné que la classification se comporte mal, je me demandais s'il serait nécessaire d'effectuer une augmentation hors ligne, c'est-à-dire agrandir l'ensemble de données avant la formation, car je pense honnêtement que 7 est loin d'être un nombre raisonnable d'images par classe.
Est-ce une pratique courante d'effectuer les deux types d'augmentation (avant et pendant la formation)? Je prévois d'utiliser des logiciels ou des outils tiers comme IMGAUG pour élargir d'abord l'ensemble de données et enregistrer les images augmentées sur le disque et alors effectuer une augmentation en temps réel avec ImageDataGenerator
classer.
En conclusion, le flux serait similaire à cela:
- Pré-traitement d'image et augmentation des données hors ligne => Agrandir l'ensemble de données d'origine
- Formation avec une augmentation en temps réel => Chargez l'ensemble de données et utilisez Imagedatagenerator
Qu'est-ce que tu penses?
Merci.
Pas de solution correcte