R: التحجيم متعدد الأبعاد

https://stackoverflow.com/questions/2343783

23-09-2019
|

سؤال

لدي عدة أسئلة:
1. ما هو الفرق بين isomds و cmdscale؟
2. هل يمكنني استخدام المصفوفة غير المتماثلة؟
3. هل هناك أي طريقة لتحديد العدد الأمثل للأبعاد (نتيجة)؟

المحلول

واحدة من أساليب MDS هي distance scaling وهي مقسمة في متري وغير متري. واحد آخر هو classical scaling (أيضا يسمى distance geometry من قبل أولئك في المعلوماتية الحيوية). يمكن تنفيذ التحجيم الكلاسيكي في R باستخدام الأمر cmdscale. يمكن تنفيذ طريقة Kruskal في تحجيم المسافة غير المتوحشة (باستخدام وظيفة الإجهاد والانحدار متساوي التوتر) باستخدام الأمر isoMDS في كتلة المكتبة. العلاج القياسي ل classical scaling ينتج عن مشكلة eigendecomposition وبالتالي هو نفس PCA إذا كان الهدف هو تخفيض الأبعاد. ال distance scaling الطرق ، من ناحية أخرى ، استخدم الإجراءات التكرارية للوصول إلى حل.
إذا كنت تشير إلى بنية المسافة ، أعتقد أنه يجب عليك تمرير بنية الفصل dist وهو كائن يحتوي على معلومات عن بعد. أو مصفوفة (متماثلة) من المسافات ، أو كائن يمكن إجباره على مثل هذه المصفوفة باستخدام as.matrix (). (كما قرأت في المساعدة ، يتم استخدام المثلث السفلي للمصفوفة فقط ، ويتم تجاهل الباقي).
(لأسلوب القياس الكلاسيكي): تتمثل إحدى طرق تحديد أبعاد التكوين الناتج في النظر إلى القيم الذاتية لـ doubly centered مصفوفة متماثلة ب (= ههه). تتمثل الإستراتيجية المعتادة في رسم القيم الذاتية المطلوبة (أو بعض الوظائف منها) ضد البعد ثم تحديد البعد الذي تصبح فيه القيم الذاتية "مستقرة" (أي ، لا تتغير بشكل إدراكي). في هذا البعد ، قد نلاحظ "كوع" يوضح أين يحدث الاستقرار (لنقاط الفضاء n-dimensional ، يجب أن يحدث الاستقرار في المؤامرة في البعد N+1). للحصول على تفسير رسومي أسهل لحل التحجيم الكلاسيكي ، نختار عادةً أن نكون صغيراً ، من الترتيب 2 أو 3.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow