Question

Je tiens à mettre en œuvre une sorte d'amélioration de l'algorithme de DBSCAN, où l'utilisateur n'a pas besoin d'entrer des paramètres d'entrée (MINTS et EPS).Mon idée est d'utiliser la parcelle K-Distances, mais quelle est la meilleure méthode pour calculer le «genou» de cette parcelle?Comment compter quand il y a 2 genoux ou plus sur la parcelle?

Où puis-je trouver le code source pour une amélioration de la DBSCAN, comme AutodbsCan, VDBSCAN, PDBSCAN ou DLBSCAN-DLP?Je cherche des bases, mais nulle part je peux trouver une bonne aide.Peut-être que vous avez vu des codes sources d'échantillonnage quelque part?

Était-ce utile?

La solution

Dbscan a déjà été amélioré à mort .

Dans Google Scholar, il dispose de 5361 citations et probablement 1000+ de ces "Améliorez" DBSCAN.Et probablement une douzaine d'entre eux utilisent le tracé K-distance.Mais aucun de ceux-ci n'est utilisé dans la pratique.

Si vous souhaitez poursuivre cette ligne de recherche, mieux vous êtes mis à jour sur ce qui a été fait depuis. En particulier, examinez l'optique qui éloigne complètement le paramètre epsilon (à l'exception des raisons de performance lors de l'utilisation d'index).

Regardez également HDBSCAN * par l'un des auteurs originaux de Dbscan, Joerg Sander.Ce sera probablement l'extension de Dbscan la plus importante en plus de son travail sur l'optique et le GDBSCAN.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top