Comment utiliser R forêts aléatoires pour réduire les attributs ayant pas de classes distinctes?

https://stackoverflow.com/questions/3198111

02-10-2019
|

Question

Je veux utiliser les forêts aléatoires pour la réduction de l'attribut. Un problème que j'ai dans mes données est que je n'ai pas de classe discrète - que continue, ce qui indique comment un exemple diffère de « normal ». Cet attribut de classe est une sorte de distance de zéro à l'infini. Est-il possible d'utiliser la forêt aléatoire pour ces données?

La solution

Cela devrait être aucun problème - RF simplement passer en mode de régression. Utilisez la fonction de randomForest du paquet randomForest.
Pour obtenir similitude d'objet avec l'argument de proximity=TRUE, comme:

randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity

Pour obtenir nœud pureté (indice de Gini comme) l'importance de l'attribut:

randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]

Pour obtenir l'augmentation moyenne de MSE (précision de diminution comme) l'importance de l'attribut:

randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow