Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé?

https://stackoverflow.com/questions/1832076

11-09-2019
|

Question

En ce qui concerne l'intelligence artificielle et l'apprentissage de la machine, quelle est la différence entre l'apprentissage supervisé et non supervisé? Pouvez-vous fournir une base, une explication facile avec un exemple?

La solution

Puisque vous posez cette question fondamentale, on dirait qu'il est utile de préciser ce que l'apprentissage automatique est lui-même.

L'apprentissage de la machine est une classe d'algorithmes qui est, à savoir basée sur les données à la différence des algorithmes « normaux », ce sont les données qui « dit » ce que la « bonne réponse » est. Exemple: un algorithme d'apprentissage hypothétique non-machine pour la détection des visages dans les images essaierait de définir ce qu'est un visage (disque de peau comme couleur ronde, avec zone sombre où vous attendez les yeux, etc.). Un algorithme d'apprentissage automatique ne serait pas une telle définition littérale, mais serait « apprendre par exemples »: vous montrer plusieurs images de visages et non-faces et un bon algorithme finira par apprendre et être en mesure de prédire si oui ou non un invisible l'image est un visage.

Cet exemple particulier de détection de visage est sous la direction , ce qui signifie que vos exemples doivent être étiquetée , ou dire explicitement quels sont ceux qui sont les visages et ceux qui ne sont pas.

Dans un sans supervision algorithme vos exemples ne sont pas étiquetée , à savoir que vous ne dites rien. Bien sûr, l'algorithme lui-même ne peut « inventer » ce visage est dans ce cas, mais il peut essayer de les données dans différents groupes, par exemple, on peut distinguer les faces qui sont très différents des paysages, qui sont très différents des chevaux.

Depuis une autre réponse mentionne (bien que, d'une manière incorrecte): il y a des "intermédiaires" formes de contrôle, à savoir semi-supervisé et apprentissage actif . Techniquement, ces méthodes sont supervisés où il y a une certaine façon « intelligente » pour éviter un grand nombre d'exemples étiquetés. Dans l'apprentissage actif, l'algorithme lui-même décide quelle chose que vous devriez étiquette (par exemple, il peut être assez sûr d'un paysage et un cheval, mais il peut vous demander de confirmer si un gorille est en effet l'image d'un visage). Dans l'apprentissage semi-supervisé, il y a deux algorithmes différents qui commencent par les exemples étiquetés, puis « dire » l'autre la façon dont ils pensent un certain nombre de données non marquées. De cette "discussion" ils apprennent.

Autres conseils

Supervisé apprentissage est lorsque les données que vous nourrissez votre algorithme avec est « étiqueté » ou « marqué », pour aider votre logique à prendre des décisions.

Exemple:. Filtrage anti-spam de Bayes, où vous devez marquer un élément comme spam pour affiner les résultats

Apprentissage non supervisé sont les types d'algorithmes qui tentent de trouver des corrélations sans entrées externes autres que les données brutes.

Exemple:. Données algorithmes de regroupement minier

Supervisé apprentissage

Applications dans lequel les données de formation comprend des exemples des vecteurs d'entrée ainsi que leurs vecteurs cibles correspondants sont connus comme des problèmes d'apprentissage supervisé.

Apprentissage non supervisé

En d'autres problèmes de reconnaissance de forme, les données d'apprentissage consiste en un ensemble de vecteurs d'entrée x sans valeurs cibles correspondantes. L'objectif de ces problèmes d'apprentissage sans supervision peut être de découvrir des groupes d'exemples similaires dans les données, où il est appelé regroupement

Reconnaissance et apprentissage automatique (Bishop, 2006)

Dans l'apprentissage supervisé, le x d'entrée est fourni avec le y résultat escompté (c.-à-la sortie du modèle est censé produire lorsque l'entrée est x), que l'on appelle souvent la « classe » ( « label » ou) la x d'entrée correspondant.

Dans l'apprentissage non supervisé, la « classe » d'un exemple x n'est pas fourni. Ainsi, l'apprentissage non supervisé peut être considéré comme trouver « structure cachée » dans le jeu de données non marqué.

Les approches à l'apprentissage supervisé comprennent:

Classement (1R, Naive Bayes, algorithme d'apprentissage de l'arbre de décision, par exemple comme ID3 CART, etc.)
Prévision numérique de la valeur

Les approches d'apprentissage non supervisé comprennent:

Clustering (K-means, classification hiérarchique)
Association Règle d'apprentissage

Par exemple, la formation très souvent un réseau de neurones est un apprentissage supervisé:. Vous dire le réseau auquel la classe correspond le vecteur de caractéristiques vous nourrissez

Clustering est non supervisée. Vous laissez l'algorithme de décider comment les échantillons dans des catégories qui partagent des propriétés communes

Un autre exemple d'apprentissage non supervisé est auto organisation cartes de Kohonen.

Je peux vous dire un exemple.

Supposons que vous devez reconnaître quel véhicule est une voiture et que l'on est une moto.

Dans l'ensemble de données supervisé l'apprentissage des cas, votre entrée (formation) jeu de données doit être étiqueté, qui est, pour chaque élément d'entrée dans votre entrée (formation), vous devez indiquer si elle représente une voiture ou une motocyclette.

Dans l'apprentissage sans supervision cas, vous ne marque pas les entrées. Le modèle non supervisé pôles de l'entrée en groupes sur la base, par exemple sur des caractéristiques similaires / propriétés. Donc, dans ce cas, il n'y a pas d'étiquettes comme « voiture ».

Je l'ai toujours trouvé la distinction entre apprentissage supervisé et non supervisé arbitraire et un peu déroutant. Il n'y a pas de distinction réelle entre les deux cas, au lieu il y a une gamme de situations dans lesquelles un algorithme peut avoir plus ou moins « supervision ». L'existence de l'apprentissage semi-supervisé est un exemple évident où la ligne est floue.

Je tends à penser que la supervision donner une rétroaction à l'algorithme sur ce qui devrait être préféré des solutions. Pour un cadre traditionnel supervisé, comme la détection de spam, vous dites l'algorithme « ne font pas d'erreur sur l'ensemble de la formation » ; pour un cadre traditionnel sans supervision, comme le regroupement, vous dites l'algorithme « points qui sont proches les uns des autres doivent être dans le même groupe » . Il se trouve que, la première forme de rétroaction est beaucoup plus spécifique que celui-ci.

En bref, quand quelqu'un dit « supervisé », pensez classification, quand ils disent « sans supervision » pense le regroupement et essayer de ne pas trop de soucis à ce sujet au-delà.

L'apprentissage de la machine: Il explore l'étude et la construction d'algorithmes qui peuvent apprendre et faire des prédictions sur les algorithmes data.Such fonctionnent en construisant un modèle à partir des entrées par exemple pour faire des prédictions basées sur des données ou des décisions exprimées en tant que sorties, plutôt que de suivre les instructions du programme strictement statiques.

Apprentissage Supervisé: Il est la tâche d'apprentissage de la machine de inférant une fonction à partir des données de formation de formation étiquetée données.Système consistent en un ensemble d'exemples de formation. En apprentissage supervisé, chaque exemple est une paire constituée d'un objet d'entrée (typiquement un vecteur) et une valeur de sortie désirée (également appelé signal de surveillance). Un algorithme d'apprentissage supervisé analyse les données de formation et produit une fonction inférées, qui peut être utilisé pour cartographier de nouveaux exemples.

L'ordinateur est présenté avec des entrées par exemple et leurs résultats souhaités, donnée par un « enseignant », et l'objectif est d'apprendre une règle générale que les cartes entrées outputs.Specifically, un algorithme d'apprentissage supervisé prend un ensemble connu des données d'entrée et les réponses connues aux données (sortie), et forme un modèle pour générer des prédictions raisonnables pour la réponse à de nouvelles données.

Apprentissage non supervisé: Il apprend sans maître. une base chose que vous pouvez faire avec des données est de le visualiser. Il est la tâche d'apprentissage de la machine de inférant une fonction pour décrire la structure cachée des données non marquées. Étant donné que les exemples donnés à l'apprenant sont sans étiquette, il n'y a aucun signal d'erreur ou de récompense pour évaluer une solution potentielle. Ce qui distingue l'apprentissage non supervisé de l'apprentissage supervisé. l'apprentissage non supervisé utilise des procédures qui tentent de trouver des partitions naturelles des motifs.

Avec l'apprentissage non supervisé il n'y a pas de commentaires sur la base des résultats de prévision, à savoir, il n'y a pas d'enseignant à corriger you.Under les méthodes d'apprentissage non supervisées pas d'exemples marqués sont fournis et il n'y a aucune notion de la production au cours de l'apprentissage processus. En conséquence, il appartient au système d'apprentissage / modèle pour trouver des modèles ou découvrir les groupes de données d'entrée

Vous devez utiliser des méthodes d'apprentissage non supervisé lorsque vous avez besoin d'un grand quantité de données pour former vos modèles, et la volonté et la capacité d'expérimenter et d'explorer, et bien sûr un défi qui est pas bien résolu par l'apprentissage non supervisé methods.With plus établie, il est possible d'apprendre des modèles plus grands et plus complexes qu'avec supervisé l'apprentissage. est un bon exemple sur elle

Apprentissage Supervisé

L'apprentissage Supervisé est basé sur la formation d'un échantillon de données de la source de données avec la classification correcte déjà attribué. De telles techniques sont utilisées dans anticipatrice ou Multilayer modèles Perceptron (MLP). Ces MLP a trois distinctif Caractéristiques:

Une ou plusieurs couches de neurones cachés qui ne font pas partie de l'entrée ou des couches de sortie du réseau qui permettent au réseau d'apprendre et résoudre des problèmes complexes
La non-linéarité reflète dans l'activité neuronale est différentiables et,
Le modèle d'interconnexion du réseau présente un degré élevé de connectivité.

Ces caractéristiques le long de l'apprentissage par la formation résoudre des problèmes difficiles et divers. L'apprentissage par la formation dans un modèle ANN supervisé aussi appelé erreur algorithme de rétropropagation. La correction d'apprentissage d'erreur algorithme entraîne le réseau sur la base de l'entrée-sortie échantillons et trouve signal d'erreur, qui est la différence de la sortie calculée et la sortie désirée et règle le les poids synaptiques des neurones qui est proportionnelle à la produit du signal d'erreur et l'instance d'entrée de la poids synaptique. Sur la base de ce principe, l'erreur de retour l'apprentissage de propagation se produit en deux passes:

Passe avant:

Ici, vecteur d'entrée est présenté au réseau. Ce signal d'entrée se propage vers l'avant, neurone par neurone à travers le réseau et débouche à l'extrémité de sortie le réseau en tant que signal de sortie: y(n) = φ(v(n)) où v(n) est le champ local d'un neurone défini par v(n) =Σ w(n)y(n). La sortie induite qui est calculée à la couche de sortie o (n) est comparée à la d(n) de réponse souhaité et trouve le e(n) d'erreur pour ce neurone. Les poids synaptiques du réseau au cours de ce passage sont reste la même.

Backward Pass:

Le signal d'erreur qui est originaire du neurone de sortie de cette couche se propage vers l'arrière à travers le réseau. Ceci calcule le gradient local pour chaque neurone dans chaque couche et permet les poids synaptiques du réseau de subir des modifications en fonction de la règle delta comme:

Δw(n) = η * δ(n) * y(n).

Ce calcul récursif se poursuit, avec passe avant suivi du passage vers l'arrière pour chaque motif d'entrée jusqu'à ce que le réseau convergé.

paradigme d'apprentissage supervisé d'un ANN est efficace et trouve des solutions à plusieurs problèmes linéaires et non linéaires tels que la classification, le contrôle de l'usine, la prévision, la prévision, la robotique, etc.

Unsupervised apprentissage

Réseaux de neurones autoorganisables apprendre en utilisant l'algorithme d'apprentissage non supervisé pour identifier les tendances cachées dans les données d'entrée non marquées. Ce non supervisé fait référence à la capacité d'apprendre et organiser l'information sans fournir un signal d'erreur pour évaluer la solution potentielle. Le manque de direction pour l'algorithme d'apprentissage dans l'apprentissage non supervisé peut parfois être avantageux, car il permet à l'algorithme de regarder en arrière pour les modèles qui ne sont pas considérés auparavant. Les principales caractéristiques des cartes auto-organisation (SOM) sont:

Il transforme un modèle de signal entrant de dimension arbitraire dans une ou deux dimensions la carte et d'effectuer cette transformation adaptative
Le réseau représente la structure à action directe avec une seule couche de calcul constitué de neurones disposés en rangées et Colonnes. A chaque étape de la représentation, chaque signal d'entrée est maintenu dans son contexte et,
Neurones traitant des éléments d'information étroitement liés sont proches ensemble et ils communiquent via des connexions synaptiques.

La couche de calcul est également appelée couche compétitive puisque les neurones dans la couche se font concurrence pour devenir actif. Par conséquent, cet algorithme d'apprentissage est appelé algorithme concurrentiel. algorithme dans UnsupervisedSOM fonctionne en trois phases:

Phase de compétition:

pour chaque motif d'entrée x, présenté au réseau, produit interne avec w de poids synaptique est calculée et les neurones dans la couche compétitive trouve une fonction discriminante qui induisent la concurrence entre les neurones et le vecteur de poids synaptique qui est proche de l'entrée vecteur dans la distance euclidienne est annoncé comme vainqueur de la compétition. Ce neurone est appelé meilleur neurone correspondant,

i.e. x = arg min ║x - w║.

Phase coopérative:

neurone gagnant détermine le centre d'un h topologique du voisinage des neurones coopérants. Ceci est réalisé par le d d'interaction latérale entre les neurones coopératifs. Ce quartier topologique réduit sa taille sur une période de temps.

Phase d'adaptation:

permet le neurone gagnant et ses neurones de voisinage pour augmenter leurs valeurs individuelles de la fonction discriminante par rapport à la configuration d'entrée grâce à des ajustements de poids synaptiques appropriés,

 Δw = ηh(x)(x –w).

Sur présentation répétée des modèles de formation, les vecteurs de poids synaptiques ont tendance à suivre la répartition des modèles d'entrée en raison de la mise à jour du quartier et ainsi ANN sans superviseur apprend.

Modèle d'auto-organisation représente naturellement le comportement neuro-biologique, et est donc utilisé dans de nombreuses applications du monde réel telles que le regroupement, la reconnaissance vocale, la segmentation de texture, vecteur de codage etc.

Référence.

Apprentissage Supervisé : Vous donnez des données par exemple diverses marquées en entrée, ainsi que les bonnes réponses. Cet algorithme en tirer des leçons, et commencer à prédire des résultats corrects en fonction des entrées par la suite. Exemple : Email filtre anti-spam

Unsupervised Learning : Vous venez de donner des données et ne dites rien - comme des étiquettes ou des réponses correctes. L'algorithme analyse automatiquement les modèles dans les données. Exemple : Google Nouvelles

Je vais essayer de garder les choses simples.

Apprentissage Supervisé: Dans cette technique d'apprentissage, nous donne un ensemble de données et le système connaît déjà la sortie correcte de l'ensemble de données. Voici donc, notre système apprend en prédisant une valeur propre. Ensuite, il fait une vérification de la précision en utilisant une fonction de coût pour vérifier à quel point sa prévision était à la sortie réelle.

Unsupervised d'apprentissage: Dans cette approche, nous avons peu ou aucune connaissance de ce que notre résultat serait. Ainsi, au lieu, nous tirons de la structure des données où l'on ne connaît pas l'effet de la variable. Nous faisons la structure en regroupant les données basées sur la relation entre la variable des données. Ici, nous n'avons pas une évaluation basée sur notre prédiction.

Apprentissage supervisé, compte tenu des données avec une réponse.

Étant donné que le spam email étiqueté / pas du spam, en savoir un filtre anti-spam.

Étant donné un ensemble de données de patients diagnostiqués comme ayant le diabète soit ou non, apprendre à classer les nouveaux patients comme ayant le diabète ou non.

Apprentissage non supervisé, compte tenu des données sans une réponse, laissez le PC à des choses du groupe.

Étant donné un ensemble d'articles de presse trouvés sur le web, le groupe INTO série d'articles sur la même histoire.

Étant donné une base de données de données personnalisées, découvrez automatiquement les segments de marché et les clients du groupe dans différents segments de marché.

Référence

Apprentissage Supervisé

En cela, chaque forme d'entrée qui est utilisé pour former le réseau est associé à un motif de sortie, qui est la cible désirée ou la modèle. Un enseignant est supposé être présent lors de l'apprentissage processus, lorsqu'une comparaison est faite entre le réseau calculé de sortie et la sortie attendue correcte, afin de déterminer l'erreur. le erreur peut alors être utilisé pour modifier les paramètres du réseau, qui se traduisent par une amélioration des performances.

Unsupervised apprentissage

Dans cette méthode d'apprentissage, la sortie cible n'est pas présenté au réseau. Il est comme s'il n'y a pas d'enseignant de présenter le choix modèle et, par conséquent, le système apprend de son propre en découvrant et l'adaptation aux caractéristiques structurelles dans les formes d'entrée.

Supervisé apprentissage

Vous avez entrée x et une sortie cible t. Donc, vous vous entraînez l'algorithme de généraliser les pièces manquantes. Il est supervisé parce que la cible est donnée. Vous êtes le superviseur dit l'algorithme: Pour l'exemple x, vous devriez sortie t

Apprentissage non supervisé

Bien que la segmentation, le regroupement et la compression sont généralement comptés dans ce sens, j'ai du mal à trouver une bonne définition pour elle.

Prenons auto-codeurs pour la compression par exemple. Même si vous avez seulement l'entrée x donnée, il est l'ingénieur humain comment l'algorithme dit que la cible est également x. Donc, dans un certain sens, ce ne diffère pas de l'apprentissage supervisé.

Et pour le regroupement et la segmentation, je ne suis pas trop sûr si elle correspond vraiment à la définition de l'apprentissage machine (voir autre question ).

Apprentissage supervisé: dire un enfant va-kinder jardin. ici maître lui enseigne 3 jouets-maison, balle et voiture. maintenant professeur lui donne 10 jouets. il les classer dans trois boîte de la maison, la balle et la voiture en fonction de son expérience. si enfant a été supervisé par les enseignants pour obtenir les bonnes réponses pour quelques jeux. puis il a été testé sur des jouets inconnus.

Apprentissage non supervisé: nouveau jardin d'enfants enfant example.A est donné 10 jouets. il est dit de ceux segment similaires. donc basée sur des fonctionnalités telles que la forme, la taille, la couleur, la fonction etc, il va essayer de faire 3 groupes dire, B, C et les groupes.

Le mot signifie que vous Supervise donnez la supervision / l'instruction à la machine pour l'aider à trouver des réponses. Une fois qu'il apprend des instructions, il peut facilement prévoir pour les nouveaux cas.

incontrôlé, ce qu'il n'y a pas de supervision ou instruction comment trouver des réponses / étiquettes et la machine utilisera son intelligence pour trouver un modèle dans nos données. Ici, il ne fera pas la prédiction, il va juste essayer de trouver des groupes qui a des données similaires.

Apprentissage Supervisé: Vous avez marqué les données et doivent apprendre de cela. données maison par exemple avec le prix et apprendre à prédire le prix

Apprentissage non supervisé: vous devez trouver la tendance et prédisez, aucune étiquette avant donnée. différentes personnes par exemple la classe, puis une nouvelle personne vient si ce groupe ne ce nouvel étudiant appartiennent.

Apprentissage Supervisé nous savons ce que l'entrée et la sortie devrait être. Par exemple, étant donné un ensemble de voitures. Nous devons savoir quels sont les rouges et les bleus qui.

Alors, Apprentissage non supervisé est l'endroit où nous devons trouver la réponse avec un très peu ou sans aucune idée sur la façon dont la sortie devrait être. Par exemple, un étudiant pourrait être en mesure de construire un modèle qui détecte lorsque les gens sourient basés sur la corrélation des motifs du visage et des mots tels que « qu'est-ce que vous fait sourire? ».

L'apprentissage Supervisé peut étiqueter un nouvel élément dans l'une des étiquettes formées sur la base sur l'apprentissage pendant la formation. Vous devez fournir un grand nombre de jeu de données de formation, ensemble de données de validation et ensemble de données de test. Si vous fournissez dire des vecteurs d'image de pixel de chiffres ainsi que des données de formation avec des étiquettes, il permet d'identifier les numéros.

L'apprentissage Unsupervised ne nécessite pas de formation des ensembles de données. Dans l'apprentissage non supervisé, il peut regrouper les éléments en différents groupes en fonction de la différence dans les vecteurs d'entrée. Si vous fournissez des vecteurs d'image de pixels de chiffres et demander à classer en 10 catégories, il peut le faire. Mais il ne sait comment il les étiquettes que vous n'avez pas fourni des étiquettes de formation.

apprentissage supervisé est fondamentalement où vous avez variables d'entrée (x) et la variable de sortie (y) et en utilisant l'algorithme d'apprendre la fonction de mappage de l'entrée à la sortie. La raison pour laquelle nous avons appelé cela comme supervisé est parce que l'algorithme apprend de l'ensemble de données de formation, l'algorithme fait itérativement des prédictions sur les données de formation. Sous la direction ont deux types de classification et de régression. La classification est lorsque la variable de sortie est catégorie comme oui / non, vrai / faux. La régression est lorsque la sortie est des valeurs réelles comme la taille de la personne, la température etc.

L'ONU a supervisé l'apprentissage est l'endroit où nous ne disposons que des données d'entrée (X) et aucune variable de sortie. On appelle cela un apprentissage non supervisé, car contrairement à l'apprentissage supervisé ci-dessus, il n'y a pas de réponses correctes et il n'y a pas d'enseignant. Les algorithmes sont laissés à leurs propres legs de découvrir et de présenter la structure intéressante dans les données.

Types d'apprentissage non supervisé sont le regroupement et d'association.

Apprentissage Supervisé est essentiellement une technique dans laquelle les données de formation à partir de laquelle la machine apprend déjà étiqueté qui suppose d'un simple classificateur nombre pair impair où vous avez déjà classé les données pendant la formation. Par conséquent, il utilise des données « Labellisé ».

L'apprentissage Unsupervised au contraire est une technique dans laquelle la machine en elle-même les étiquettes de données. Ou vous pouvez dire son cas lorsque la machine apprend par lui-même à partir de zéro.

Simple Supervisé d'apprentissage est le type de problème d'apprentissage machine dans lequel nous avons des étiquettes et en utilisant que les étiquettes que nous mettons en algorithme comme la régression et la classification .Classification est appliquée où notre production est comme sous la forme de 0 ou 1, vrai / faux, oui / non. et la régression est appliquée lorsque à mettre une valeur réelle d'une telle maison de prix

Unsupervised Learning est un type de problème d'apprentissage de la machine dans laquelle nous ne nous avons pas eu tout moyen d'étiquettes des données uniquement, les données non structurées et nous devons regrouper les données (regroupement de données) en utilisant divers algorithme non supervisé

Machine Learning Supervisé

"Le processus d'un algorithme d'apprentissage de jeu de données et la formation   prédire la sortie. «

Précision de sortie prédite directement proportionnelle aux données d'apprentissage (longueur)

L'apprentissage Supervisé est l'endroit où vous avez des variables d'entrée (x) (ensemble de données de formation) et une variable de sortie (Y) (jeu de données de test) et que vous utilisez un algorithme pour apprendre la fonction de mappage de l'entrée à la sortie.

Y = f(X)

Les principaux types:

Classification (axe y discret)
prédictive (axe continu)

Algorithmes:

Algorithmes de classification:

Neural Networks  
Naïve Bayes classifiers  
Fisher linear discriminant  
KNN 
Decision Tree 
Super Vector Machines

Les algorithmes prédictifs:

Nearest  neighbor  
Linear Regression,Multi Regression

Domaines d'application:

Classifier emails comme spam
Classifier si le patient a maladie ou pas
Reconnaissance vocale
Prédire HR sélectionner candidat ou non
Prédire le prix du marché boursier

apprentissage supervisé :

Un algorithme d'apprentissage supervisé analyse les données de formation et produit une fonction inférées, qui peut être utilisé pour cartographier de nouveaux exemples.

Nous fournissons des données de formation et nous savons une sortie correcte pour une certaine entrée
Nous savons relation entre l'entrée et la sortie

Catégories de problème:

régression:. prédire les résultats dans une production en continu => variables d'entrée de carte à une fonction continue

Exemple:

Étant donné une image d'une personne, prédire son âge

Classement: Prédire les résultats dans une sortie discrète => variables d'entrée de carte dans des catégories distinctes

Exemple:

Est-ce Tumer cancéreuse?

Apprentissage non supervisé:

L'apprentissage Unsupervised apprend à partir des données de test qui n'a pas été étiquetés, classés ou classés. l'apprentissage non supervisé identifie les points communs dans les données et réagit basée sur la présence ou l'absence de ces points communs dans chaque nouvelle donnée.

On peut déduire cette structure en regroupant les données basées sur les relations entre les variables dans les données.
Il n'y a pas de commentaires sur la base des résultats de prédiction.

Catégories de problème:

Clustering: est la tâche de regrouper un ensemble d'objets de telle sorte que les objets dans le même groupe (appelé cluster) sont similaires (dans un certain sens ) de l'autre que pour ceux des autres groupes (clusters)

Exemple:

Prenez une collection de 1.000.000 gènes différents, et trouver un moyen de regrouper automatiquement ces gènes dans des groupes qui sont en quelque sorte similaires ou connexes par différentes variables, telles que la durée de vie, le lieu, les rôles, etc. .

cas d'utilisation populaires sont listés ici.

différence entre le classement et le regroupement dans le secteur minier de données?

Références:

Supervised_learning

Unsupervised_learning

apprentissage automatique à partir Coursera

towardsdatascience

Apprentissage Supervisé

Unsupervised apprentissage

Exemple:

Apprentissage Supervisé:

Un sac à la pomme
Un sac à l'orange

=> modèle de construction
Un sac mixte de pomme et d'orange.

=> S'il vous plaît classer

Unsupervised d'apprentissage:

Un sac mixte de pomme et d'orange.

=> modèle de construction
Un autre sac mixte

=> S'il vous plaît classer

En simples mots .. :) Si je comprends bien, ne hésitez pas à corriger. est supervisé l'apprentissage, nous savons ce que nous prévoyons sur la base des données fournies. Nous avons donc une colonne dans l'ensemble de données qui doit être fondée. Apprentissage non supervisé est, nous essayons d'extraire du sens à partir de l'ensemble de données fourni. Nous n'avons pas la clarté sur ce qu'il faut prédire. Alors la question est la raison pour laquelle nous le faisons .. :) réponse est - le résultat de l'apprentissage non surveillé de groupes / groupes (données similaires ensemble). Donc, si nous recevons de nouvelles données nous associons qui avec le groupe / groupe identifié et comprendre ses caractéristiques.

Je l'espère vous aider.

apprentissage supervisé

est où nous avons supervisé l'apprentissage connaît la sortie de l'entrée brute, à savoir les données sont étiquetés de telle sorte que lors de la formation du modèle d'apprentissage de la machine, il comprendra ce qu'il faut pour détecter dans la sortie de donner, et il guidera le système pendant la formation pour détecter les objets pré-étiquetés sur cette base, il détecte les objets similaires que nous avons fournis dans la formation.

Ici, les algorithmes savent quelle est la structure et la structure des données. L'apprentissage supervisé est utilisé pour la classification

À titre d'exemple, nous pouvons avoir un différents objets dont les formes sont carré, cercle, trianle notre tâche est d'organiser les mêmes types de formes l'ensemble de données ont marqué toutes les formes marquées, et nous allons former le modèle d'apprentissage de la machine sur cet ensemble de données, sur la base de la formation dateset il commencera à détecter les formes.

L'apprentissage non-supervisée

L'apprentissage est un apprentissage non supervisé où le résultat sans guide final ne soit pas connu, il regroupera l'ensemble de données et basée sur des propriétés similaires de l'objet, il divisera les objets sur différentes grappes et détecter les objets.

Voici les algorithmes rechercheront les différents motifs dans les données brutes, et en fonction de ce qu'elle regroupera les données. apprentissage supervisé Un est utilisé pour le regroupement.

À titre d'exemple, nous pouvons avoir des objets différents de multiples formes carrées, cercle, triangle, il fera les grappes en fonction des propriétés de l'objet, si un objet a quatre côtés il considérer carré, et si elle a trois côtés triangle et si aucun autre que le cercle, ici les données ne sont pas étiquetés, elle s'apprendre à détecter les différentes formes

Il y a beaucoup de réponses déjà qui expliquent en détail les différences. J'ai trouvé ces gifs sur Codecademy et ils me permettent souvent d'expliquer les différences efficacement.

Apprentissage Supervisé

Notez que les images de formation ont des étiquettes ici et que le modèle apprend les noms des images.

Unsupervised apprentissage

Notez que ce qui se fait ici est tout regroupement (regroupement) et que le modèle ne sait rien sur une image.

L'apprentissage de la machine est un domaine dans lequel vous essayez de faire la machine à imiter le comportement humain.

Vous formez la machine comme un être humain moyen baby.The apprendre, identifier les caractéristiques, reconnaître des modèles et de former lui-même, comme vous former la machine en intégrant des données avec diverses fonctions. algorithme de la machine identifier le modèle dans les données et les classer dans la catégorie particulière.

L'apprentissage machine largement divisée en deux catégories, sous la supervision et l'apprentissage non supervisé.

L'apprentissage Supervisé est le concept où vous avez vecteur d'entrée / données avec une valeur cible correspondant (sortie) .Sur d'autre part l'apprentissage non supervisé est le concept où vous avez seulement des vecteurs d'entrée / données sans aucune valeur cible correspondante.

Un exemple d'apprentissage supervisé est la reconnaissance manuscrite chiffres où vous avez l'image de chiffres avec le chiffre correspondant [0-9], et un exemple d'apprentissage non supervisé est Le regroupement des clients en achetant le comportement.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow