Impossible de trouver nInputPlane dans SpatialConvolution dans la torche?
Question
documentaion de l'aménagement Convolution définie comme
module = nn.SpatialConvolution(nInputPlane, nOutputPlane, kW, kH, [dW], [dH], [padW], [padH])
nInputPlane. Le nombre de plans d'entrée prévus dans l'image donnée dans l'avant ()
nOutputPlane. Le nombre de plans de sortie de la couche de convolution produira
Je n'ai aucune expérience avec la torche, mais je crois que je l'ai utilisé une fonction similaire dans keras
Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))
qui prend en entrée la forme de l'image qui est 256 * 256 en rgb.
J'ai lu l'utilisation de l'espace dans la torche Convolution comme ci-dessous, mais incapable de comprendre ce qui fait le correspondent de paramter nInputPlane et nOutputPlane à?
local convLayer = nn.SpatialConvolutionMM(384, 384, 1, 1, 1, 1, 0, 0)
Dans le code ci-dessus ce qui fait ces 384384 représentent?
La solution
Le nInputPlane est la profondeur ou le nombre de couches de l'image d'entrée. Dans le cas d'images RVB, cela devrait être 3 qui correspond au premier nombre dans le input_shape=(3, 256, 256)
.
Le nOutputPlane est le nombre de couches du volume que l'étape de convolution produira qui est aussi le nombre de filtres / grains appliqués à l'entrée. Par convention, il y a une couche de sortie pour chaque filtre. Ceci correspond au premier argument de la fonction de Convolution2D
.