Question

documentaion de l'aménagement Convolution définie comme

module = nn.SpatialConvolution(nInputPlane, nOutputPlane, kW, kH, [dW], [dH], [padW], [padH])

nInputPlane. Le nombre de plans d'entrée prévus dans l'image donnée dans l'avant ()

nOutputPlane. Le nombre de plans de sortie de la couche de convolution produira

Je n'ai aucune expérience avec la torche, mais je crois que je l'ai utilisé une fonction similaire dans keras

Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))

qui prend en entrée la forme de l'image qui est 256 * 256 en rgb.

J'ai lu l'utilisation de l'espace dans la torche Convolution comme ci-dessous, mais incapable de comprendre ce qui fait le correspondent de paramter nInputPlane et nOutputPlane à?

local convLayer = nn.SpatialConvolutionMM(384, 384, 1, 1, 1, 1, 0, 0)

Dans le code ci-dessus ce qui fait ces 384384 représentent?

Était-ce utile?

La solution

Le nInputPlane est la profondeur ou le nombre de couches de l'image d'entrée. Dans le cas d'images RVB, cela devrait être 3 qui correspond au premier nombre dans le input_shape=(3, 256, 256).

Le nOutputPlane est le nombre de couches du volume que l'étape de convolution produira qui est aussi le nombre de filtres / grains appliqués à l'entrée. Par convention, il y a une couche de sortie pour chaque filtre. Ceci correspond au premier argument de la fonction de Convolution2D.

Licencié sous: CC-BY-SA avec attribution
scroll top