La recherche dans les algorithmes forestiers au hasard en mesure de passer des ensembles de données

https://datascience.stackexchange.com/questions/9560

16-10-2019
|

Question

Je suis curieux de savoir si on fait des recherches dans les forêts aléatoires qui combinent sans supervision avec l'apprentissage supervisé de façon à permettre un seul algorithme pour trouver des modèles dans et travailler avec, plusieurs ensembles de données différentes. J'ai googlé tous les moyens possibles de trouver des recherches sur ce sujet, et ont mis au point vide. point que quelqu'un peut me dans la bonne direction?

La solution

Apprentissage semi-supervisé

La combinaison de l'apprentissage non supervisé et l'apprentissage supervisé est appelé semi-supervised learning , qui est le concept que je crois que vous recherchez.

Label propagation est souvent cité lors de la présentation des heuristiques de semi-supervised learning. L'essence est d'employer le regroupement, mais d'utiliser un ensemble minuscule des cas connus afin d'en tirer (ou propager) les étiquettes des clusters. D'où l'on est en mesure d'utiliser un petit nombre de cas étiquetés de manière à classer un ensemble beaucoup plus vaste de données sans supervision.

Voici quelques références:

Wikipedia a une entrée sur la semi-supervised learning.
Le Guide de l'utilisateur scikit apprendre est souvent un point de départ utile et a une routine d'étiquette propogation .
Il y a, en fait, les documents traitent semi-supervised random forest .
Un autre

Hope this helps!

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange