Frage

In einer typischen, überwachten Lerneinstellung mit einigen positiven und einigen negativen Beispielen ist klar, dass nicht beliebte Daten einige Informationen enthalten, die das Lernen zugute kommen können und die in den beschrifteten Daten nicht erfasst werden. Zum Beispiel kann man Mittelwerte, Grenzen und einige andere geometrische Merkmale des Datensatzes mit viel höherer Genauigkeit schätzen, wenn Sie die (massiven) nicht massiven Daten nicht verwerfen.

Andererseits nutzen die häufigsten ML -Algorithmen von neuronalen Netzwerken bis zu SVM diese Informationen nicht (zumindest in ihrem Standard, am häufigsten). Meine Frage:

  • Gibt es einen theoretischen Rahmen, in dem in der beaufsichtigten Einstellung unbezeichnete Daten behandelt werden?

Ich kann mir halbüberwachende Möglichkeiten vorstellen, dies zu nähern (zuerst Cluster und dann die Cluster zu beschriften). Gibt es noch andere?

War es hilfreich?

Lösung

In einem neuronalen Netzwerkmodell können Sie verwenden Autoencoder.

Die Grundidee eines AutoCoders besteht darin, eine versteckte Merkmalsebene zu erlernen, indem ein Netzwerk erstellt wird, das den Eingangsvektor einfach am Ausgang kopiert. Daher sind die Trainingsmerkmale und Schulungsbezeichnungen anfangs identisch, es sind keine beaufsichtigten Etiketten erforderlich. Dies kann mit einem Klassiker funktionieren dreieckig Netzwerkarchitektur mit zunehmend kleineren Schichten, die einen komprimierten und hoffentlich nützlichen Satz abgeleiteter Funktionen erfassen. Die versteckten Ebenen des Netzwerks lernen Darstellungen basierend auf dem größeren unbeaufsichtigten Datensatz. Diese Ebenen können dann verwendet werden, um ein regelmäßiges überwachendes Lernnetzwerk mit den tatsächlichen Etiketten zu initialisieren.

Eine ähnliche Idee sind Schichten vor dem Training mit a Eingeschränkte Boltzmann -Maschine, die auf sehr ähnliche Weise verwendet werden können, obwohl sie auf verschiedenen Prinzipien beruhen.

Andere Tipps

Sie haben das Schlüsselwort "Semi-Superviseed" in Ihrer Frage bereits fallen gelassen. In der Tat ist das semi-übersichtliche Lernen die Antwort auf Ihre Frage. Suchen Sie nach diesem Begriff mit Ihrem bevorzugten Suchmaschinen- oder Bibliothekskatalog, um sich über Algorithmen für das halbübergreifende Lernen zu informieren.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top