Pipeline recommandée d'augmentation des données

https://datascience.stackexchange.com/questions/37621

31-10-2019
|

Question

Je souhaite effectuer une classification d'images à l'aide de keras et un ensemble de données composé de 50 classes. Pour le moment, je n'ai que 7 images par classe et j'ai besoin d'effectuer une augmentation des données afin de former le modèle et d'obtenir des valeurs de précision acceptables.

J'utilise le ImageDataGenerator classe de kéras qui est recommandé pour l'augmentation de l'image à la volée (pendant la formation). Étant donné que la classification se comporte mal, je me demandais s'il serait nécessaire d'effectuer une augmentation hors ligne, c'est-à-dire agrandir l'ensemble de données avant la formation, car je pense honnêtement que 7 est loin d'être un nombre raisonnable d'images par classe.

Est-ce une pratique courante d'effectuer les deux types d'augmentation (avant et pendant la formation)? Je prévois d'utiliser des logiciels ou des outils tiers comme IMGAUG pour élargir d'abord l'ensemble de données et enregistrer les images augmentées sur le disque et alors effectuer une augmentation en temps réel avec ImageDataGenerator classer.

En conclusion, le flux serait similaire à cela:

Pré-traitement d'image et augmentation des données hors ligne => Agrandir l'ensemble de données d'origine
Formation avec une augmentation en temps réel => Chargez l'ensemble de données et utilisez Imagedatagenerator

Qu'est-ce que tu penses?

Merci.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange