Domanda

In un tipico ambiente di apprendimento supervisionato con pochi positiva e alcuni esempi negativi, è chiaro che i dati non marcato trasporta alcune informazioni che possono beneficiare di apprendimento e che non è catturato nei dati etichettati. Per esempio si può stimare valori medi, limiti e alcune altre caratteristiche geometriche del set di dati con precisione molto maggiore se non scartare i massicci () dati non etichettati.

D'altra parte, la maggior parte dei comuni algoritmi di ML da reti neurali a SVM non approfittare di queste informazioni (almeno nella loro serie, forma più comune). La mia domanda:

  • C'è un quadro teorico in cui i dati non marcato è trattata nel contesto sorvegliato?

I può pensare di modi semi-supervisionato per affrontare questo (primo cluster e poi etichettare i cluster). Ci sono altri?

È stato utile?

Soluzione

In un modello di rete neurale, è possibile utilizzare autoencoders .

L'idea di base di un autoencoder è quello di imparare un livello nascosto di funzioni con la creazione di una rete che copia semplicemente il vettore di ingresso in uscita. Quindi le funzioni di allenamento e di formazione "etichette" sono inizialmente identici, non sono necessarie etichette vigilati. Questo può funzionare utilizzando una classica triangolare un'architettura di rete con livelli progressivamente più piccole che cattura un insieme compresso e auspicabilmente utile di caratteristiche derivate. strati nascosti della rete imparano rappresentazioni sulla base del più grande insieme di dati senza sorveglianza. Questi strati possono poi essere utilizzati per inizializzare un normale rete di apprendimento supervisionato per essere addestrato utilizzando le etichette attuali.

Un'idea simile è strati di pre-formazione con un ristretta Boltzmann macchina, che può essere utilizzato in un modo molto simile, anche se basato su principi diversi.

Altri suggerimenti

È già sceso la parola chiave "semi-supervisionata" nella sua interrogazione. In effetti, l'apprendimento semi-supervisionato è la risposta alla tua domanda. Cerca questo termine con il vostro motore di ricerca preferito o catalogo della biblioteca per scoprire algoritmi per la semi-supervisionato apprendimento.

scroll top