Investigación en algoritmos forestales aleatorios capaces de cambiar conjuntos de datos

https://datascience.stackexchange.com/questions/9560

16-10-2019
|

Pregunta

Tengo curiosidad sobre si la investigación se ha realizado en bosques aleatorios que combinan sin supervisión con el aprendizaje supervisado de una manera que permite que un solo algoritmo encuentre patrones y trabaje con múltiples conjuntos de datos diferentes. He buscado en Google todas las formas posibles de encontrar investigación sobre esto, y he quedado vacío. ¿Alguien puede señalarme en la dirección correcta?

Solución

Aprendizaje semi-supervisado

La combinación de aprendizaje no supervisado y aprendizaje supervisado se conoce como semi-supervised learning, que es el concepto que creo que estás buscando.

Label propagation a menudo se cita al delinear la heurística de semi-supervised learning. La esencia es emplear la agrupación, pero usar un pequeño conjunto de casos conocidos para derivar (o propagar) las etiquetas de los grupos. Por lo tanto, uno puede usar un pequeño conjunto de casos etiquetados para clasificar un conjunto mucho más grande de datos no supervisados.

Aquí hay algunas referencias:

Wikipedia tiene una entrada en el semi-supervised learning.
La Guía del usuario de Scikit Learn es a menudo un punto de partida útil y tiene una rutina de propogación de etiquetas.
De hecho, hay documentos que tratan semi-supervised random forest modelos.
Otro aquí

¡Espero que esto ayude!

Licenciado bajo: CC-BY-SA con atribución

No afiliado a datascience.stackexchange