Quelles méthodes peuvent être utilisées pour détecter la duplicacy dans l'ensemble de données d'images?

https://datascience.stackexchange.com/questions/38924

data-cleaning
deep-learning
predictive-modeling
ensemble-modeling
image-classification

31-10-2019
|

Question

Je souhaite supprimer des images en double d'un ensemble de données de 50 millions d'images. Quelle est la meilleure méthode pour détecter tous les doublons?

Pensez-vous que l'apprentissage d'un coup est bon pour cela?

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange