Frage

Laut „Einführung in Neuronale Netze mit Java Von Jeff Heaton“, die Eingabe in das neuronale Netzwerk Kohonen müssen die Werte zwischen -1 und 1.

Es ist möglich zu normalisieren Eingänge, bei denen der Bereich vorher bekannt ist: Zum Beispiel RGB (125, 125, 125), wobei der Bereich Know als Wert zwischen 0 und 255:
1. Teilen von 255: (125/255) = 0,5 >> (0.5,0.5,0.5)
2. Multiplizieren von zwei und subtrahieren: ((0,5 * 2) -1) = 0 >> (0,0,0)

Die Frage ist, wie können wir den Eingang zu normalisieren, wo der Bereich wie unsere Größe oder Gewicht unbekannt ist.

Auch erwähnen einige andere Papiere, dass die Eingabe auf die Werte zwischen 0 und 1. Welches ist der richtige Weg ist, normalisiert werden müssen „-1 und 1“ oder „0 und 1“?

War es hilfreich?

Lösung

Sie können jederzeit eine Quetschung Funktion eine unendliche Intervall ein endliches Intervall abzubilden. Z.B. Sie können tanh.

Sie möchten vielleicht tanh verwenden (x * l) mit einem manuell gewählt l obwohl, um nicht zu verlieren zu viele Objekte in derselben Region. Wenn Sie also eine gute Vermutung haben, dass die Maximalwerte Ihrer Daten sind +/- 500, könnten Sie zu verwenden tanh wollen (x / 1000) als eine Abbildung, wobei x der Wert des Objekts ist, könnte es sogar sinnvoll sein, zu subtrahieren Ihre erraten, der Mittelwert aus x, wodurch man tanh ((x - Mittelwert) / max).

Andere Tipps

Von dem, was ich weiß, über Kohonen SOM, sie spezifische Normalisierung ist nicht wirklich wichtig.

Nun, es könnte durch gezielte Auswahl für den Wert der Parameter des Lernalgorithmus, aber das Wichtigste ist, dass die verschiedenen Dimensionen des Eingangspunktes in der gleichen Größenordnung sein.

Stellen Sie sich vor, dass jeder Datenpunkt nicht einen Pixel mit den RGB-Komponenten drei ist aber ein Vektor mit statistischen Daten für ein Land, z.B. Fläche, Bevölkerung, .... Es ist wichtig für die Konvergenz des Lernteils, dass alle diese Zahlen in der gleichen Größenordnung liegen.

Daher tut es nicht wirklich wichtig, wenn Sie nicht wissen, den genauen Bereich, die Sie gerade etwa die charakteristische Amplitude Ihrer Daten wissen müssen.

Für Gewicht und die Größe, ich bin sicher, dass, wenn man sie teilen jeweils von 200kg und 3 Meter alle Datenpunkte fallen in] 0 1] Intervall. Man könnte sogar verwenden 50kg und 1 Meter das Wichtigste ist, dass alle Koordinaten der Ordnung 1 sein würde.

Schließlich könnten Sie betrachten einige lineare Analyse-Tools wie POD auf den Daten ausgeführt wird, die Sie automatisch einen Weg geben würde, Ihre Daten und ein Unterraum für die Initialisierung der Karte zu normalisieren.

Hope, das hilft.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top