Forschung in zufälligen Waldalgorithmen, die Datensätze wechseln können

https://datascience.stackexchange.com/questions/9560

16-10-2019
|

Frage

Ich bin gespannt, ob Forschungen in zufällige Wälder durchgeführt wurden, die mit dem überwachten Lernen auf eine Weise unbeaufsichtigt kombinieren, die es einem einzelnen Algorithmus ermöglicht, Muster zu finden und mit mehreren verschiedenen Datensätzen zu arbeiten. Ich habe jede mögliche Art gegoogelt, um Nachforschungen an diesem zu finden, und bin leer. Kann mir jemand in die richtige Richtung verweisen?

Lösung

Semi-betriebliches Lernen

Die Kombination aus unbeaufsichtigtem Lernen und beaufsichtigtes Lernen wird als bezeichnet als semi-supervised learning, was das Konzept ist, nach dem Sie glauben, dass Sie suchen.

Label propagation wird oft bei der Umrissen der Heuristik von zitiert semi-supervised learning. Die Essenz besteht darin, Clustering zu verwenden, aber einen winzigen Satz bekannter Fälle zu verwenden, um die Beschriftungen der Cluster abzuleiten (oder zu propagieren). Daher kann man einen kleinen Satz beschrifteter Fälle verwenden, um einen viel größeren Satz unbeaufsichtigter Daten zu klassifizieren.

Hier sind einige Referenzen:

Wikipedia hat einen Eintrag in die semi-supervised learning.
Der Scikit Learn -Benutzerhandbuch ist oft ein nützlicher Ausgangspunkt und verfügt über eine Etikettenpropagationsroutine.
Es gibt tatsächlich die Behandlung von Papieren, die behandelt werden semi-supervised random forest Modelle.
Ein anderer hier

Hoffe das hilft!

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit datascience.stackexchange