كيفية استخدام الغابات العشوائية R لتقليل السمات التي لا تحتوي على فئات منفصلة؟

StackOverflow https://stackoverflow.com/questions/3198111

سؤال

أريد استخدام غابات عشوائية لتقليل السمات. إحدى المشكلات التي أواجهها في بياناتي هي أنه ليس لدي فئة منفصلة - مستمر فقط ، مما يشير إلى كيف يختلف المثال عن "طبيعي". سمة الفصل هذه هي نوع من المسافة من الصفر إلى اللانهاية. هل هناك أي طريقة لاستخدام غابة عشوائية لمثل هذه البيانات؟

هل كانت مفيدة؟

المحلول

لا ينبغي أن يكون ذلك مشكلة - سوف يتحول RF إلى وضع الانحدار. يستخدم randomForest وظيفة من randomForest حزمة.
للحصول على تشابه الكائن مع proximity=TRUE الحجة ، مثل:

randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity

للحصول على أهمية العقدة (جندي الجيني مثل) أهمية السمة:

randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]

للحصول على زيادة أهمية زيادة MSE (دقة مثل) أهمية السمة:

randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top