无法在火炬中的空间卷积中找出ninputplane?
题
空间卷积的文献将其定义为
module = nn.SpatialConvolution(nInputPlane, nOutputPlane, kW, kH, [dW], [dH], [padW], [padH])
ninputplane:给出的图像中的预期输入平面的数量()。
NOUTPUTPLANE:卷积层将产生的输出平面数。
我没有火炬的经验,但我想我在喀拉斯
Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))
它以输入为输入RGB中的图像形状为256*256。
我已经阅读了在割炬中的空间卷积的用法,如下所示,但无法弄清楚ninputplane和noutputplane paramter与什么相对应?
local convLayer = nn.SpatialConvolutionMM(384, 384, 1, 1, 1, 1, 0, 0)
在上面的代码中,这384,384代表什么?
解决方案
ninputplane是输入图像的深度或层数。对于RGB图像,这应该是3 input_shape=(3, 256, 256)
.
NOUTPUTPLANE是卷积步骤将产生的卷层的数量,这也是应用于输入的过滤器/内核的数量。按照惯例,每个过滤器都有一个输出层。这对应于 Convolution2D
功能。