La recherche dans les algorithmes forestiers au hasard en mesure de passer des ensembles de données
-
16-10-2019 - |
Question
Je suis curieux de savoir si on fait des recherches dans les forêts aléatoires qui combinent sans supervision avec l'apprentissage supervisé de façon à permettre un seul algorithme pour trouver des modèles dans et travailler avec, plusieurs ensembles de données différentes. J'ai googlé tous les moyens possibles de trouver des recherches sur ce sujet, et ont mis au point vide. point que quelqu'un peut me dans la bonne direction?
La solution
Apprentissage semi-supervisé
La combinaison de l'apprentissage non supervisé et l'apprentissage supervisé est appelé semi-supervised learning
, qui est le concept que je crois que vous recherchez.
Label propagation
est souvent cité lors de la présentation des heuristiques de semi-supervised learning
. L'essence est d'employer le regroupement, mais d'utiliser un ensemble minuscule des cas connus afin d'en tirer (ou propager) les étiquettes des clusters. D'où l'on est en mesure d'utiliser un petit nombre de cas étiquetés de manière à classer un ensemble beaucoup plus vaste de données sans supervision.
Voici quelques références:
- Wikipedia a une entrée sur la
semi-supervised learning
. - Le Guide de l'utilisateur scikit apprendre est souvent un point de départ utile et a une routine d'étiquette propogation .
- Il y a, en fait, les documents traitent
semi-supervised
random forest
. - Un autre
Hope this helps!