R: Mehrdimensionale Skalierung
-
23-09-2019 - |
Frage
Ich habe mehrere Fragen:
1. Was ist der Unterschied zwischen Isomds und CMDScale?
2. Darf ich eine asymmetrische Matrix verwenden?
3. Gibt es eine Möglichkeit, eine optimale Anzahl von Dimensionen (im Ergebnis) zu bestimmen?
Lösung
Eine der MDS -Methoden ist
distance scaling
und es ist in metrisch und nicht metrisch geteilt. Ein anderer ist derclassical scaling
(auch genanntdistance geometry
von denen in Bioinformatik). Die klassische Skalierung kann in R durch die Verwendung des Befehls durchgeführt werdencmdscale
. Die Methode von Krukal zur nicht metrischen Entfernungsskalierung (unter Verwendung der Spannungsfunktion und der isotonischen Regression) kann mit dem Befehl durchgeführt werdenisoMDS
in der Bibliotheksmasse. Die Standardbehandlung vonclassical scaling
Ergibt ein Eigenschaftsproblem und ist als solches das gleiche wie PCA, wenn das Ziel die Dimensionalitätsreduzierung ist. Dasdistance scaling
Methoden hingegen verwenden iterative Verfahren, um zu einer Lösung zu gelangen.Wenn Sie sich auf die Entfernungsstruktur beziehen, sollten Sie eine Struktur der Klasse bestehen
dist
Welches ist ein Objekt mit Entfernungsinformationen. Oder eine (symmetrische) Matrix von Entfernungen oder ein Objekt, das mit As.matrix () zu einer solchen Matrix gezwungen werden kann. (Wie ich in der Hilfe gelesen habe, wird nur das untere Dreieck der Matrix verwendet, der Rest wird ignoriert).(Für die klassische Skalierungsmethode): Eine Möglichkeit, die Dimensionalität der resultierenden Konfiguration zu bestimmen, besteht darin, die Eigenwerte des
doubly centered
symmetrische Matrix B (= hah). Die übliche Strategie besteht darin, die geordneten Eigenwerte (oder eine Funktion von ihnen) gegen Dimension zu zeichnen und dann eine Dimension zu identifizieren, in der die Eigenwerte „stabil“ werden (dh nicht wahrnehmend ändert). In dieser Dimension können wir einen „Ellbogen“ beobachten, der zeigt, wo Stabilität auftritt (für Punkte eines n-dimensionalen Raums sollte die Stabilität im Diagramm bei Dimension n+1 auftreten). Für eine leichtere grafische Interpretation einer klassischen Skalierungslösung wählen wir normalerweise N für die Reihenfolge 2 oder 3.