Incapace di capire nInputPlane in SpatialConvolution a torcia?

https://datascience.stackexchange.com/questions/14329

16-10-2019
|

Domanda

documentaion Assetto Convoluzione definiscono come

module = nn.SpatialConvolution(nInputPlane, nOutputPlane, kW, kH, [dW], [dH], [padW], [padH])

nInputPlane:. Il numero di piani di ingresso previsti nell'immagine proposta in avanti ()

nOutputPlane:. Il numero di piani di uscita dello strato convoluzione produrrà

Non ho alcuna esperienza con la torcia, ma mi sa che ho usato una funzione simile in keras

Convolution2D(64, 3, 3, border_mode='same', input_shape=(3, 256, 256))

che prende in ingresso la forma dell'immagine che è 256 * 256 in rgb.

Ho l'uso di lettura spaziale convoluzione in torcia, come di seguito, ma in grado di capire cosa fa il paramter corrispondono nInputPlane e nOutputPlane a?

local convLayer = nn.SpatialConvolutionMM(384, 384, 1, 1, 1, 1, 0, 0)

Nel codice sopra quello che fa queste 384.384 rappresentare?

Soluzione

Il nInputPlane è la profondità o il numero degli strati dell'immagine in ingresso. In caso di immagini RGB, questo dovrebbe essere 3 che corrisponde al primo numero della input_shape=(3, 256, 256).

Il nOutputPlane è il numero degli strati di volume che la fase convoluzione produrrà che è anche il numero di filtri / kernel applicati all'ingresso. Per convenzione, v'è uno strato di output per ogni filtro. Questo corrisponde al primo argomento della funzione Convolution2D.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a datascience.stackexchange