Question

Quelqu'un peut-il m'expliquer comment créer des ensembles de données plus complexes, tels que statistiques d'équipe, météo, dés, types de nombres complexes

Je comprends toutes les maths et comment tout fonctionne, je ne sais tout simplement pas comment entrer des données plus complexes, puis comment lire les données qu’elles crache

si quelqu'un pouvait fournir des exemples en python, ce serait très utile

Était-ce utile?

La solution

Vous devez coder votre entrée et votre sortie en quelque chose qui peut être représenté par les unités de réseau neuronal. (Par exemple, 1 pour "x a une certaine propriété p" -1 pour "x n'a pas de propriété p" si la plage de vos unités est dans [-1, 1])

La façon dont vous encodez votre entrée et celle que vous décodez votre sortie dépendent de la raison pour laquelle vous souhaitez entraîner le réseau de neurones.

De plus, il existe de nombreux "réseaux de neurones". algorithmes et règles d'apprentissage pour différentes tâches (Back propagation, machines Boltzman, cartes auto-organisables).

Autres conseils

Vos entités doivent être décomposées en parties pouvant être représentées sous forme de nombres réels. La magie d’un réseau de neurones est que c’est une boîte noire, les associations correctes seront établies (avec des poids internes) lors de la formation

Entrées

Choisissez le nombre de fonctionnalités nécessaires pour décrire la situation avec précision, puis décomposez-les en un ensemble de valeurs réelles.

  • Météo: [temp aujourd'hui, humidité aujourd'hui, temp hier, humidité hier ...] l'association entre la température d'aujourd'hui et l'humidité du jour est établie de manière interne
  • Stats de l'équipe: [taille moyenne, poids moyen, taille maximale, meilleur score, ...]
  • Dice: je ne suis pas sûr de comprendre celui-ci. Voulez-vous dire comment coder des valeurs discrètes? *
  • Numéro du complexe: [a, ai , b, bi , ...]

* Les entités valorisées discrètes sont délicates, mais peuvent toujours être codées comme (0.0,1.0). Le problème est qu’ils ne fournissent pas de dégradé pour connaître le seuil.

Résultats

Vous décidez ce que vous voulez que le résultat produise, puis vous codez vos exemples de formation dans ce format. Moins il y a de valeurs de sortie, plus l'entraînement est facile.

  • Météo: [risque de pluie demain, température de demain, ...] **
  • Stats de l'équipe: [chance de gagner, chance de gagner par plus de 20, ...]
  • Numéro du complexe: [x, xi , ...]

** Ici vos vecteurs entraînement seraient: 1,0 s'il pleuvait le lendemain, 0,0 s'il ne pleuvait pas

Bien sûr, la question de savoir si le problème peut être modélisé par un réseau de neurones est une autre question.

Des données plus complexes impliquent généralement d’ajouter plus de neurones dans les couches d’entrée et de sortie.

Vous pouvez alimenter chaque " champ " de votre registre, correctement codé comme une valeur réelle (normalisée, etc.) pour chaque neurone d'entrée, ou peut-être même vous décomposer encore plus dans des champs de bits, en affectant des entrées saturées de 1 ou 0 aux neurones ... pour la sortie, cela dépend de la façon dont vous formez le réseau de neurones, il va essayer d’imiter les sorties du jeu d’entraînement.

Vous devez ajouter le nombre d'unités d'entrée et de sortie nécessaires au problème. Si la fonction inconnue à approximer dépend du paramètre n , vous aurez n unités d’entrée. Le nombre d'unités de sortie dépend de la nature de la fonction. Pour les fonctions réelles avec n paramètres réels, vous aurez une unité de sortie.

Quelques problèmes, par exemple lors de la prévision de séries chronologiques, vous aurez m unités en sortie pour les m valeurs successives de la fonction. Le codage est important et dépend de l'algorithme choisi. Par exemple, dans la rétropropagation des réseaux à anticipation, il est préférable de transformer, si possible, le plus grand nombre d'entités dans les entrées discrètes, comme pour les tâches de classification.

Un autre aspect du codage est que vous devez évaluer le nombre d'unités d'entrée et cachées en fonction de la quantité de données. Trop d'unités liées aux données peuvent donner une mauvaise approximation en raison du problème de dimensionnalité du parcours. Dans certains cas, vous pouvez regrouper certaines données d'entrée pour éviter ce problème ou utiliser un mécanisme de réduction en tant que PCA.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top