Forschung in zufälligen Waldalgorithmen, die Datensätze wechseln können
-
16-10-2019 - |
Frage
Ich bin gespannt, ob Forschungen in zufällige Wälder durchgeführt wurden, die mit dem überwachten Lernen auf eine Weise unbeaufsichtigt kombinieren, die es einem einzelnen Algorithmus ermöglicht, Muster zu finden und mit mehreren verschiedenen Datensätzen zu arbeiten. Ich habe jede mögliche Art gegoogelt, um Nachforschungen an diesem zu finden, und bin leer. Kann mir jemand in die richtige Richtung verweisen?
Lösung
Semi-betriebliches Lernen
Die Kombination aus unbeaufsichtigtem Lernen und beaufsichtigtes Lernen wird als bezeichnet als semi-supervised learning
, was das Konzept ist, nach dem Sie glauben, dass Sie suchen.
Label propagation
wird oft bei der Umrissen der Heuristik von zitiert semi-supervised learning
. Die Essenz besteht darin, Clustering zu verwenden, aber einen winzigen Satz bekannter Fälle zu verwenden, um die Beschriftungen der Cluster abzuleiten (oder zu propagieren). Daher kann man einen kleinen Satz beschrifteter Fälle verwenden, um einen viel größeren Satz unbeaufsichtigter Daten zu klassifizieren.
Hier sind einige Referenzen:
- Wikipedia hat einen Eintrag in die
semi-supervised learning
. - Der Scikit Learn -Benutzerhandbuch ist oft ein nützlicher Ausgangspunkt und verfügt über eine Etikettenpropagationsroutine.
- Es gibt tatsächlich die Behandlung von Papieren, die behandelt werden
semi-supervised
random forest
Modelle. - Ein anderer hier
Hoffe das hilft!