Pregunta

De acuerdo con "Introducción a las redes neuronales con Java Por Jeff Heaton", la entrada a la red neuronal de Kohonen deben ser los valores entre -1 y 1.

Es posible entradas normalizar donde el rango es conocido de antemano: Por ejemplo RGB (125, 125, 125) donde el rango que se conoce como valores entre 0 y 255:
1. Dividir por 255: (125/255) = 0,5 >> (0.5,0.5,0.5)
2. Multiplicar por dos y restar uno: ((0,5 * 2) -1) = 0 >> (0,0,0)

La pregunta es ¿cómo podemos normalizar la entrada de las que se desconoce como nuestra altura o el peso de la gama.

Además, algunos otros documentos mencionan que la entrada debe ser normalizado a los valores entre 0 y 1. ¿Cuál es la forma correcta "-1 y 1" o "0 y 1"?

¿Fue útil?

Solución

Siempre se puede utilizar una función de aplastamiento para asignar un intervalo infinito a un intervalo finito. P.ej. puede utilizar tanh.

Es posible que desee utilizar tanh (x * l) con una l elegido de forma manual, sin embargo, con el fin de no poner demasiados objetos en la misma región. Así que si usted tiene una buena suposición de que los valores máximos de los datos son +/- 500, es posible que desee utilizar tanh (x / 1000) como un mapeo donde x es el valor de su objeto Incluso podría tener sentido para restar su adivinar de la media de x, produciendo tanh ((x - media) / max).

Otros consejos

Por lo que sé acerca de Kohonen SOM, que la normalización específica en realidad no importa.

Bien, puede ser a través de opciones específicas para el valor de los parámetros del algoritmo de aprendizaje, pero lo más importante es que las diferentes dimensiones de sus puntos de entrada tienen que ser de la misma magnitud.

Imagine que cada punto de datos no es un píxel con los tres componentes RGB pero un vector con datos estadísticos para un país, por ejemplo, superficie, población, .... Es importante para la convergencia de la parte de aprendizaje que todos estos números son de la misma magnitud.

Por lo tanto, en realidad no importa si usted no sabe el rango exacto, sólo hay que saber aproximadamente la característica de amplitud de sus datos.

Para el peso y tamaño, estoy seguro de que cuando se separan, respectivamente, por 200 kg y 3 metros de todos los puntos de datos caen en el intervalo de 0 1]]. Incluso se puede utilizar 50 kg y 1 metro de la cosa importante es que todas las coordenadas serían de orden 1.

Por último, se podría considerar una ejecución de algunas herramientas de análisis lineales como POD en los datos que le daría automáticamente una forma de normalizar sus datos y un subespacio para la inicialización de su mapa.

Espero que esto ayude.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top