質問

属性削減のためにランダムフォレストを使用したいです。データにある問題の1つは、個別のクラスがないことです。これは、「通常」との例がどのように異なるかを示す連続的なクラスのみです。このクラス属性は、ゼロからインフィニティまでの距離の一種です。そのようなデータにランダムフォレストを使用する方法はありますか?

役に立ちましたか?

解決

それは問題ではないはずです - RFは回帰モードに切り替えるだけです。使用する randomForest からの関数 randomForest パッケージ。
オブジェクトの類似性を取得します proximity=TRUE 議論、次のようになります:

randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity

Node-Purity(Gini-Indexのような)の重要性を取得するには:

randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]

平均的なMSEの増加(精度のようなもの)の重要性の重要性を得るには:

randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top