Pregunta

Puede alguien explicar de una manera sencilla y clara de cómo funciona MPEG4 para comprimir los datos. Lo que más me interesa en vídeo. Sé que hay diferentes normas o partes a la misma. Sólo estoy buscando el método de compresión global predominante, si hay uno con MPEG4.

¿Fue útil?

Solución

MPEG-4 es un gran estándar, y emplea muchas técnicas para lograr las altas tasas de compresión que es capaz de hacer.

En general, la compresión de vídeo se refiere a tirar tanta información como sea posible, mientras que tener un efecto mínimo en la experiencia de visualización para un usuario final. Por ejemplo, usando YUV submuestreada en lugar de RGB reduce el tamaño del vídeo en el medio inmediato. Esto es posible ya que el ojo humano es menos sensible al color de lo que es el brillo. En YUV, el valor de Y es el brillo, y los valores U y V representan color. Por lo tanto, se puede tirar un poco de la información de color que reduce el tamaño del archivo, sin que el espectador notar ninguna diferencia.

Después de eso, la mayoría de las técnicas de compresión se aprovechan de 2 redundancias en particular. La primera es la redundancia temporal y el segundo es la redundancia espacial.

redundancia temporal señala que los marcos sucesivos en una secuencia de vídeo son muy similares. Normalmente, un video sería del orden de 20-30 cuadros por segundo, y casi nada cambia en 1/30 de segundo. Tome cualquier DVD y hacer una pausa, a continuación, pasar por un marco y tenga en cuenta la similitud de las 2 imágenes son. Así, en lugar de codificar cada trama de manera independiente, MPEG-4 (y otros estándares de compresión) solamente codifican la diferencia entre cuadros sucesivos (usando estimación de movimiento para encontrar la diferencia entre imágenes)

Redundancia espacial se aprovecha del hecho de que, en general, la difusión a través de las imágenes de color tiende a ser bastante baja frecuencia. Con esto quiero decir que los píxeles vecinos tienden a tener colores similares. Por ejemplo, en una imagen de que llevaba un suéter rojo, todos los píxeles que representan el puente tendría color muy similar. Es posible utilizar la DCT para transformar los valores de píxel en el espacio de frecuencia, donde algunos información de alta frecuencia puede ser desechado. Entonces, cuando se realiza la DCT inversa (durante la decodificación), la imagen es ahora sin la información de alta frecuencia tirado.

Para ver los efectos de tirar información de alta frecuencia, abierto MS pintar y dibujar una serie de superposición de líneas negras horizontales y verticales. Guardar la imagen como un archivo JPEG (que también utiliza la DCT para la compresión). Ahora zoom en el patrón, observe cómo los bordes de las líneas no son tan nítidas más y son un poco borrosa. Esto se debe a alguna información de frecuencia alta (la transición de negro a blanco) ha sido desechado durante la compresión. Leer esto para una explicación con imágenes

Para la lectura adicional, este libro es bastante bueno, aunque un poco pesado en las matemáticas.

Otros consejos

Al igual que cualquier otro códec de vídeo populares, MPEG4 utiliza una variación de transformada discreta del coseno y una variedad de técnicas de compensación de movimiento (que se pueda imaginar como el movimiento de predicción de si eso ayuda) que reducen la cantidad de datos necesarios para los fotogramas siguientes. Esta página tiene una visión general de lo que se hace por MPEG4 sin formato.

No es totalmente diferente a las técnicas utilizadas por JPEG.

MPEG4 utiliza una variedad de técnicas para comprimir video.

Si no lo ha mirado en Wikipedia, esto sería una buena punto .

Hay también este artículo de la IEEE que explica estos técnicas con más detalle.

Los bordes afilados ciertamente contienen altas frecuencias. Reducir o eliminar las altas frecuencias reduce la nitidez de los bordes. Incluyendo los detalles finos bordes afilados se retira con una alta frecuencia de remoción - bilidad de resolver 2 objetos pequeños se elimina con altas frecuencias. - entonces usted ve un solo

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top