La ricerca in algoritmi foresta casuale grado di insiemi di dati di commutazione

https://datascience.stackexchange.com/questions/9560

16-10-2019
|

Domanda

Sono curioso di vedere se la ricerca stato fatto in foreste casuali che si combinano senza sorveglianza con l'apprendimento supervisionato in modo da consentire un unico algoritmo per trovare i modelli di e lavoriamo, più set di dati diversi. Googled tutti i modi di trovare la ricerca su questo, e sono venuto a mani vuote. Qualcuno può punto me nella giusta direzione?

Soluzione

apprendimento semi-supervisionato

La combinazione di apprendimento non supervisionato e apprendimento supervisionato si riferisce a come semi-supervised learning , che è il concetto che credo che si sta cercando.

Label propagation è spesso citato quando delineare le euristiche di semi-supervised learning. L'essenza è di impiegare clustering, ma utilizzare un piccolo insieme di casi noti al fine di ricavare (o propogate) le etichette dei cluster. Quindi si è in grado di utilizzare un piccolo insieme di casi etichettati per classificare un insieme molto maggiore di dati non presidiati.

Qui ci sono alcuni riferimenti:

Wikipedia ha una voce sulla semi-supervised learning .
Lo scikit imparare Guida per l'utente è spesso un utile punto di partenza ed ha una routine di propagazione un'etichetta .
Non ci sono, infatti, le carte in cura semi-supervised random forest modelli .
un altro qui

Spero che questo aiuti!

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a datascience.stackexchange