Lorsque vous utilisez l'augmentation des données, est-il acceptable de valider uniquement avec les images originales?

https://datascience.stackexchange.com/questions/41422

01-11-2019
|

Question

Je travaille sur un algorithme d'apprentissage en profondeur multi-classification et je devenais un grand trop ajusté:

Mon modèle est censé classer les lunettes de soleil sur 17 marques différentes, mais je n'avais qu'environ 400 images de chaque marque, j'ai donc créé un dossier avec des données augmentées x3 fois, générant des images avec ces paramètres:

datagen = ImageDataGenerator(
    rotation_range=30,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')

Après cela, j'ai obtenu ces résultats:

Je ne sais pas s'il est correct de faire la validation uniquement en utilisant les images originales ou si je dois utiliser également les images augmentées pour la validation, c'est également étrange pour moi d'obtenir une précision plus élevée sur la validation que la formation.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange