Rランダムフォレストを使用して、個別のクラスを持たない属性を減らす方法は？

https://stackoverflow.com/questions/3198111

02-10-2019
|

質問

属性削減のためにランダムフォレストを使用したいです。データにある問題の1つは、個別のクラスがないことです。これは、「通常」との例がどのように異なるかを示す連続的なクラスのみです。このクラス属性は、ゼロからインフィニティまでの距離の一種です。そのようなデータにランダムフォレストを使用する方法はありますか？

解決

それは問題ではないはずです - RFは回帰モードに切り替えるだけです。使用する randomForest からの関数 randomForest パッケージ。
オブジェクトの類似性を取得します proximity=TRUE 議論、次のようになります：

randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity

Node-Purity（Gini-Indexのような）の重要性を取得するには：

randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]

平均的なMSEの増加（精度のようなもの）の重要性の重要性を得るには：

randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow