Das Finden der Ausbreitung eines jeden Clusters aus Kmeans

https://stackoverflow.com/questions/2320595

22-09-2019
|

Frage

Ich versuche zu erkennen, wie gut ein Eingangsvektor ein bestimmtes Clusterzentrum paßt. Ich kann die beste Übereinstimmung finden ganz leicht (das Zentrum mit dem kleinsten euklidischen Abstand zu dem Eingangsvektor der best ist), aber ich jetzt brauche Arbeit, wie gut ein Spiel, das ist.

Dieses ich tun müssen, um die Ausbreitung (Standardabweichung?) Der Vektoren, die Ansammlung der Schwerpunkt zu finden, sehen dann, wenn der Abstand von meinem Eingangsvektor in die Mitte kleiner ist als die Ausbreitung. Wenn sie mehr als die Ausbreitung ist, als ich in der Lage sein sollte, zu sagen, dass ich keine Cluster haben es zu passen (vorausgesetzt, dass die am besten nicht den Eingangsvektor gut passt).

Ich bin mir nicht sicher, wie die Ausbreitung pro Cluster zu finden. Ich habe alle die Mittelvektoren und alle Trainingsvektoren sind mit ihren engsten Cluster markiert, kann ich einfach nicht ganz Klafter genau das, was ich zu tun, um die Ausbreitung zu erhalten.

Ich hoffe, das ist klar? Wenn nicht, ich werde versuchen, es neu zu formulieren! TIA Ian

Lösung

Verwenden Sie die Distanzfunktion und berechnen Sie die Entfernung von Ihrem Mittelpunkt zu jedem Punkt markiert, dann herauszufinden, die Mittel dieser Abstände aus. Das sollten Sie die Standardabweichung geben.

Andere Tipps

Wenn Sie schalten einen anderen Algorithmus, wie Mischung aus Gaussians zu verwenden, erhalten Sie die Verbreitung (zum Beispiel std. Abweichung) als Teil des Modells (Clustering Ergebnis).

http://home.deib.polimi.it/matteucc/ Clustering / tutorial_html / mixture.html

http://en.wikipedia.org/wiki/Mixture_model

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow