traitement théorique d'échantillons non marqués

https://datascience.stackexchange.com/questions/9027

16-10-2019
|

Question

Dans un cadre d'apprentissage supervisé typique avec quelques positifs et quelques exemples négatifs, il est clair que les données sans étiquette comporte des informations qui peuvent bénéficier d'apprentissage et qui n'est pas capturé dans les données étiquetées. Par exemple, on peut estimer les valeurs moyennes, limites et d'autres caractéristiques géométriques de l'ensemble de données avec une précision beaucoup plus élevé si vous ne jetez pas les (énormes) données non marquées.

D'autre part, les plus communs algorithmes ML de réseaux de neurones à SVM ne profitent pas de ces informations (au moins dans leur norme, forme la plus courante). Ma question:

Y at-il cadre théorique où les données sans étiquette est traitée dans le cadre supervisé?

Je peux penser à des façons de semi-supervisé d'aborder ce (premier groupe, puis étiqueter les grappes). Y at-il d'autres?

La solution

Dans un modèle de réseau de neurones, vous pouvez utiliser autoencoders .

L'idée de base d'un autoencoder est d'apprendre une couche cachée de fonctionnalités en créant un réseau qui copie simplement le vecteur d'entrée à la sortie. Ainsi, les fonctions de formation et de formation « labels » sont initialement identiques, aucune étiquette sous surveillance sont nécessaires. Cela peut fonctionner en utilisant un classique triangulaire architecture réseau avec des couches progressivement plus petites qui capturent un ensemble comprimé et nous espérons utile de fonctionnalités dérivées. du réseau de couches cachées apprennent des représentations en fonction de l'ensemble de données sans supervision plus. Ces couches peuvent ensuite être utilisées pour initialiser un réseau d'apprentissage supervisé régulièrement être formés en utilisant les étiquettes réelles.

Une idée similaire couches pré-formation à l'aide d'un restreint Boltzmann machine, qui peut être utilisé d'une manière très similaire, bien que fondée sur des principes différents.

Autres conseils

Vous avez déjà laissé tomber dans votre question le mot-clé « semi-supervisé ». En effet, l'apprentissage semi-supervisé est la réponse à votre question. Chercher ce terme avec votre moteur de recherche préféré ou catalogue de la bibliothèque pour en savoir plus sur les algorithmes d'apprentissage semi-supervisé.

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange