Comprender claramente la figura: ilustración de una arquitectura de red neuronal convolucional (CNN) para la clasificación de oraciones

datascience.stackexchange https://datascience.stackexchange.com/questions/23990

Pregunta

Estoy estudiando el blog: Comprensión de las redes neuronales convolucionales para PNL. Es un muy buen blog.

Una cosa que no puedo entender claramente sobre este blog. Como la ilustración de la figura de una arquitectura de la red neuronal convolucional (CNN) para la clasificación de oraciones a continuación:

enter image description here

Quiero preguntar:

  1. Sé que el tamaño de la región (2,3,4) es como una palabra de 2 gramos, 3 gramos, 4 gramos, pero ¿cuál es el significado de los filtros numéricos? Aquí hay 2 filtros para cada región. ¿Por qué en el código del autor sobre la clasificación de oraciones se define el número de filtros a 128? ¿Podría dar ejemplos para explicar el significado del número de filtros? Por ejemplo, usar la oración de 'Me gusta mucho esta película sería genial.

2) Entiendo que la altura del tamaño de la región (4) es 4, pero en la figura, la altura de la región (2, 3) son 5 y 6 respectivamente, ¿no sé por qué? Creo que la altura de la región es 2 y 3.

No hay solución correcta

Licenciado bajo: CC-BY-SA con atribución
scroll top