Document Incorpore vs Hachage sensible à la localité pour le regroupement de documents
Question
Je voudrais comparer deux méthodes: Hachage de sensibilité de la localité et documenter l'intégration pour obtenir la similitude entre deux documents. Ces deux méthodes codent les informations d'un document dans un vecteur que je voudrais utiliser pour trouver des documents similaires dans un très grand corpus (potentiellement plus de 100 000 documents). Quelqu'un a-t-il déjà comparé ces deux méthodes et quels sont les avantages de chacun d'eux.
Bravo à l'avance
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange