空间卷积的文献将其定义为

module = nn.SpatialConvolution(nInputPlane, nOutputPlane, kW, kH, [dW], [dH], [padW], [padH])

ninputplane:给出的图像中的预期输入平面的数量()。

NOUTPUTPLANE:卷积层将产生的输出平面数。

我没有火炬的经验,但我想我在喀拉斯

Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))

它以输入为输入RGB中的图像形状为256*256。

我已经阅读了在割炬中的空间卷积的用法,如下所示,但无法弄清楚ninputplane和noutputplane paramter与什么相对应?

local convLayer = nn.SpatialConvolutionMM(384, 384, 1, 1, 1, 1, 0, 0)

在上面的代码中,这384,384代表什么?

有帮助吗?

解决方案

ninputplane是输入图像的深度或层数。对于RGB图像,这应该是3 input_shape=(3, 256, 256).

NOUTPUTPLANE是卷积步骤将产生的卷层的数量,这也是应用于输入的过滤器/内核的数量。按照惯例,每个过滤器都有一个输出层。这对应于 Convolution2D 功能。

许可以下: CC-BY-SA归因
scroll top