Quelles méthodes peuvent être utilisées pour détecter la duplicacy dans l'ensemble de données d'images?
Question
Je souhaite supprimer des images en double d'un ensemble de données de 50 millions d'images. Quelle est la meilleure méthode pour détecter tous les doublons?
Pensez-vous que l'apprentissage d'un coup est bon pour cela?
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange