Comment utiliser R forêts aléatoires pour réduire les attributs ayant pas de classes distinctes?
-
02-10-2019 - |
Question
Je veux utiliser les forêts aléatoires pour la réduction de l'attribut. Un problème que j'ai dans mes données est que je n'ai pas de classe discrète - que continue, ce qui indique comment un exemple diffère de « normal ». Cet attribut de classe est une sorte de distance de zéro à l'infini. Est-il possible d'utiliser la forêt aléatoire pour ces données?
La solution
Cela devrait être aucun problème - RF simplement passer en mode de régression. Utilisez la fonction de randomForest
du paquet randomForest
.
Pour obtenir similitude d'objet avec l'argument de proximity=TRUE
, comme:
randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity
Pour obtenir nœud pureté (indice de Gini comme) l'importance de l'attribut:
randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]
Pour obtenir l'augmentation moyenne de MSE (précision de diminution comme) l'importance de l'attribut:
randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]