Investigación en algoritmos forestales aleatorios capaces de cambiar conjuntos de datos
-
16-10-2019 - |
Pregunta
Tengo curiosidad sobre si la investigación se ha realizado en bosques aleatorios que combinan sin supervisión con el aprendizaje supervisado de una manera que permite que un solo algoritmo encuentre patrones y trabaje con múltiples conjuntos de datos diferentes. He buscado en Google todas las formas posibles de encontrar investigación sobre esto, y he quedado vacío. ¿Alguien puede señalarme en la dirección correcta?
Solución
Aprendizaje semi-supervisado
La combinación de aprendizaje no supervisado y aprendizaje supervisado se conoce como semi-supervised learning
, que es el concepto que creo que estás buscando.
Label propagation
a menudo se cita al delinear la heurística de semi-supervised learning
. La esencia es emplear la agrupación, pero usar un pequeño conjunto de casos conocidos para derivar (o propagar) las etiquetas de los grupos. Por lo tanto, uno puede usar un pequeño conjunto de casos etiquetados para clasificar un conjunto mucho más grande de datos no supervisados.
Aquí hay algunas referencias:
- Wikipedia tiene una entrada en el
semi-supervised learning
. - La Guía del usuario de Scikit Learn es a menudo un punto de partida útil y tiene una rutina de propogación de etiquetas.
- De hecho, hay documentos que tratan
semi-supervised
random forest
modelos. - Otro aquí
¡Espero que esto ayude!