Pregunta

Documento para la convolución espacial lo defina como

module = nn.SpatialConvolution(nInputPlane, nOutputPlane, kW, kH, [dW], [dH], [padW], [padH])

NinutPutplane: el número de planos de entrada esperados en la imagen dada en Forward ().

Noutputplane: el número de planos de salida que producirá la capa de convolución.

No tengo ninguna experiencia con la antorcha, pero supongo que he usado una función similar en keras

Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))

que toma como entrada la forma de la imagen que es 256*256 en RGB.

He leído el uso de la convolución espacial en la antorcha como se muestra a continuación, pero no puedo averiguar a qué corresponde el Ninputplane y NoutputPlane Paramter.

local convLayer = nn.SpatialConvolutionMM(384, 384, 1, 1, 1, 1, 0, 0)

En el código anterior, ¿qué representan estos 384,384?

¿Fue útil?

Solución

El Ninputplane es la profundidad o el número de capas de la imagen de entrada. En el caso de las imágenes RGB, esto debería ser 3 que corresponde al primer número en el input_shape=(3, 256, 256).

El NoutputPlane es el número de capas del volumen que producirá el paso de convolución, que también es el número de filtros/núcleos aplicados a la entrada. Por convención, hay una capa de salida para cada filtro. Esto corresponde al primer argumento del Convolution2D función.

Licenciado bajo: CC-BY-SA con atribución
scroll top