La ricerca in algoritmi foresta casuale grado di insiemi di dati di commutazione
-
16-10-2019 - |
Domanda
Sono curioso di vedere se la ricerca stato fatto in foreste casuali che si combinano senza sorveglianza con l'apprendimento supervisionato in modo da consentire un unico algoritmo per trovare i modelli di e lavoriamo, più set di dati diversi. Googled tutti i modi di trovare la ricerca su questo, e sono venuto a mani vuote. Qualcuno può punto me nella giusta direzione?
Soluzione
apprendimento semi-supervisionato
La combinazione di apprendimento non supervisionato e apprendimento supervisionato si riferisce a come semi-supervised learning
, che è il concetto che credo che si sta cercando.
Label propagation
è spesso citato quando delineare le euristiche di semi-supervised learning
. L'essenza è di impiegare clustering, ma utilizzare un piccolo insieme di casi noti al fine di ricavare (o propogate) le etichette dei cluster. Quindi si è in grado di utilizzare un piccolo insieme di casi etichettati per classificare un insieme molto maggiore di dati non presidiati.
Qui ci sono alcuni riferimenti:
- Wikipedia ha una voce sulla
semi-supervised learning
. - Lo scikit imparare Guida per l'utente è spesso un utile punto di partenza ed ha una routine di propagazione un'etichetta .
- Non ci sono, infatti, le carte in cura
semi-supervised
random forest
modelli . - un altro qui
Spero che questo aiuti!