R: التحجيم متعدد الأبعاد
-
23-09-2019 - |
سؤال
لدي عدة أسئلة:
1. ما هو الفرق بين isomds و cmdscale؟
2. هل يمكنني استخدام المصفوفة غير المتماثلة؟
3. هل هناك أي طريقة لتحديد العدد الأمثل للأبعاد (نتيجة)؟
المحلول
واحدة من أساليب MDS هي
distance scaling
وهي مقسمة في متري وغير متري. واحد آخر هوclassical scaling
(أيضا يسمىdistance geometry
من قبل أولئك في المعلوماتية الحيوية). يمكن تنفيذ التحجيم الكلاسيكي في R باستخدام الأمرcmdscale
. يمكن تنفيذ طريقة Kruskal في تحجيم المسافة غير المتوحشة (باستخدام وظيفة الإجهاد والانحدار متساوي التوتر) باستخدام الأمرisoMDS
في كتلة المكتبة. العلاج القياسي لclassical scaling
ينتج عن مشكلة eigendecomposition وبالتالي هو نفس PCA إذا كان الهدف هو تخفيض الأبعاد. الdistance scaling
الطرق ، من ناحية أخرى ، استخدم الإجراءات التكرارية للوصول إلى حل.إذا كنت تشير إلى بنية المسافة ، أعتقد أنه يجب عليك تمرير بنية الفصل
dist
وهو كائن يحتوي على معلومات عن بعد. أو مصفوفة (متماثلة) من المسافات ، أو كائن يمكن إجباره على مثل هذه المصفوفة باستخدام as.matrix (). (كما قرأت في المساعدة ، يتم استخدام المثلث السفلي للمصفوفة فقط ، ويتم تجاهل الباقي).(لأسلوب القياس الكلاسيكي): تتمثل إحدى طرق تحديد أبعاد التكوين الناتج في النظر إلى القيم الذاتية لـ
doubly centered
مصفوفة متماثلة ب (= ههه). تتمثل الإستراتيجية المعتادة في رسم القيم الذاتية المطلوبة (أو بعض الوظائف منها) ضد البعد ثم تحديد البعد الذي تصبح فيه القيم الذاتية "مستقرة" (أي ، لا تتغير بشكل إدراكي). في هذا البعد ، قد نلاحظ "كوع" يوضح أين يحدث الاستقرار (لنقاط الفضاء n-dimensional ، يجب أن يحدث الاستقرار في المؤامرة في البعد N+1). للحصول على تفسير رسومي أسهل لحل التحجيم الكلاسيكي ، نختار عادةً أن نكون صغيراً ، من الترتيب 2 أو 3.