R: Mehrdimensionale Skalierung

https://stackoverflow.com/questions/2343783

23-09-2019
|

Frage

Ich habe mehrere Fragen:
1. Was ist der Unterschied zwischen Isomds und CMDScale?
2. Darf ich eine asymmetrische Matrix verwenden?
3. Gibt es eine Möglichkeit, eine optimale Anzahl von Dimensionen (im Ergebnis) zu bestimmen?

Lösung

Eine der MDS -Methoden ist distance scaling und es ist in metrisch und nicht metrisch geteilt. Ein anderer ist der classical scaling (auch genannt distance geometry von denen in Bioinformatik). Die klassische Skalierung kann in R durch die Verwendung des Befehls durchgeführt werden cmdscale. Die Methode von Krukal zur nicht metrischen Entfernungsskalierung (unter Verwendung der Spannungsfunktion und der isotonischen Regression) kann mit dem Befehl durchgeführt werden isoMDS in der Bibliotheksmasse. Die Standardbehandlung von classical scaling Ergibt ein Eigenschaftsproblem und ist als solches das gleiche wie PCA, wenn das Ziel die Dimensionalitätsreduzierung ist. Das distance scaling Methoden hingegen verwenden iterative Verfahren, um zu einer Lösung zu gelangen.
Wenn Sie sich auf die Entfernungsstruktur beziehen, sollten Sie eine Struktur der Klasse bestehen dist Welches ist ein Objekt mit Entfernungsinformationen. Oder eine (symmetrische) Matrix von Entfernungen oder ein Objekt, das mit As.matrix () zu einer solchen Matrix gezwungen werden kann. (Wie ich in der Hilfe gelesen habe, wird nur das untere Dreieck der Matrix verwendet, der Rest wird ignoriert).
(Für die klassische Skalierungsmethode): Eine Möglichkeit, die Dimensionalität der resultierenden Konfiguration zu bestimmen, besteht darin, die Eigenwerte des doubly centered symmetrische Matrix B (= hah). Die übliche Strategie besteht darin, die geordneten Eigenwerte (oder eine Funktion von ihnen) gegen Dimension zu zeichnen und dann eine Dimension zu identifizieren, in der die Eigenwerte „stabil“ werden (dh nicht wahrnehmend ändert). In dieser Dimension können wir einen „Ellbogen“ beobachten, der zeigt, wo Stabilität auftritt (für Punkte eines n-dimensionalen Raums sollte die Stabilität im Diagramm bei Dimension n+1 auftreten). Für eine leichtere grafische Interpretation einer klassischen Skalierungslösung wählen wir normalerweise N für die Reihenfolge 2 oder 3.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow