R: многомерное масштабирование
-
23-09-2019 - |
Вопрос
У меня есть несколько вопросов:
1. В чем разница между изоми и cmdscale?
2. Могу ли я использовать асимметричную матрицу?
3. Есть ли способ определить оптимальное количество измерений (в результате)?
Решение
Один из методов MDS
distance scaling
и он разделен на метрическую и неэтричную. Другой - этоclassical scaling
(также называемыйdistance geometry
те, кто находится в биоинформатике). Классическое масштабирование может быть выполнено в R с использованием командыcmdscale
. Анкет Метод не -метрового расстояния (с использованием функции напряжения и изотонической регрессии) может быть выполнен с использованием команды (с использованием функции напряжения и изотонической регрессии)isoMDS
в библиотеке массы. Стандартное лечениеclassical scaling
дает проблему с собственным знакомым и как таковая такая же, как PCA, если целью является снижение размерности. Аdistance scaling
Методы, с другой стороны, используют итерационные процедуры для достижения решения.Если вы обратитесь к структуре расстояния, я думаю, вы должны пройти структуру класса
dist
который является объектом с информацией о расстоянии. Или (симметричная) матрица расстояний или объект, который может быть принужден к такой матрице с использованием as.matrix (). (Как я читал в помощи, используется только нижний треугольник матрицы, остальное игнорируется).(Для классического метода масштабирования): Одним из способов определения размерности результирующей конфигурации является рассмотрение собственных значений
doubly centered
Симметричная матрица B (= ха). Обычная стратегия состоит в том, чтобы построить упорядоченные собственные значения (или некоторых их функций) против измерения, а затем определить измерение, при котором собственные значения становятся «стабильными» (то есть не меняются перцептивно). В этом измерении мы можем наблюдать «локоть», который показывает, где происходит стабильность (для точек n-мерного пространства стабильность на графике должна возникать в измерении n+1). Для более легкой графической интерпретации классического масштабируемого решения мы обычно выбираем N быть небольшим, порядка 2 или 3.