Compresión DCT - Tamaño de Bloque, la Elección de los Coeficientes de

https://stackoverflow.com/questions/1955663

21-09-2019
|

Pregunta

Estoy tratando de comprender el efecto del Tamaño del Bloque y la mejor estrategia de elección de los Coeficientes de la DCT de compresión.Básicamente quiero preguntar lo que escribió aquí:

Compresión De Vídeo:¿Qué es la transformada discreta del coseno?

Vamos a asumir la forma más primitiva de compresión.Fabricación de bloques de una imagen.La realización de una DCT en cada blog y la reducción a cero de algunos coeficientes.

A mi entender, el más pequeño es el bloque de la mejor.Bloques más pequeños significa que los Píxeles están más correlacionados por tanto la energía en la DCT espectro es más "Compacto".Debe ser más hincapié en una rápida variación de imágenes (de Alta Frecuencia).

Digamos que cero fuera de un cierto porcentaje de los coeficientes, lo que resultaría en una mejor calidad de imagen, pequeñas o grandes bloques?Digamos que mantener, 10%, 25%, 50%, 75%, diría que es una respuesta diferente para un porcentaje diferente?

Otra cuestión es cómo eligió los coeficientes de dejar intacta.Para que no digamos que tengo que tomar una decisión basada en la ubicación y no la energía.Le tome un cuadrado de la esquina superior izquierda?He generado muchos bloque en el DCT espectro, y concluyeron que la mejor sería tomar un triángulo de la esquina superior izquierda.¿Qué te parece?

Espero que podamos tener un debate eficaz.

Solución

La esencia de su pregunta, parece ser acerca de la calidad de la imagen.Ha habido una considerable literatura producida sobre el tema, y el resultado es que la calidad de la imagen es una cosa difícil de determinar.

Estándar error matemático medidas como la relación señal-a-ruido (SNR) y la media del error cuadrado medio (MSE) puede dar una respuesta cuantitativa, pero es bien sabido que estos no se correlacionan bien con la subjetiva visor de opiniones, lo cual debe ser nuestra autoridad final.No hay otros métodos, incluso los que se basan en psico-modelos visuales del espectador (por ejemplo, S. A.Karunasekera y N. G.Kingsbury, "Una distorsión de la medida para el bloqueo de los artefactos en las imágenes que se fundamentan en la sensibilidad visual", IEEE Trans.sobre la Imagen Proc.vol.4, no.6 de junio de 1995, pp.713 -724;y M.Miyahara, K.Kotani, y V.R.Algazi, "Objetivo de calidad de imagen en escala (PQS) para la codificación de imágenes", IEEE Trans.en Comm.vol.46, no.9, Sept.1998, pp.1215 -1226), han demostrado ser mejor que la SNR.

Por otra parte, cuando se varía el tipo de imágenes (de la línea de dibujo, caricatura, fotografía, retrato, etc.), ciertos tipos de compresión, distorsión se hacen más evidentes.Ruido de Mosquito puede ser objetable en una imagen, mientras que la escalera de ruido podría ser el culpable en otro.

En resumen, no se puede contestar a su pregunta, "¿cuál sería el resultado en la mejor calidad de imagen?"

Dicho esto, podemos decir algunas cosas acerca de la DCT que son de relevancia.Los píxeles de una DCT de un bloque de ir de variación baja a la alta variación en un patrón de zigzag desde la esquina superior izquierda [(0,0)->(0,1)->(1,0)->(2,0)->(1,1)->(0,2)->etc.] como su triángulo de selección de los espejos.Cuanto más cerca de un píxel de la esquina superior izquierda, la más suave de la información contenida en la misma [de hecho, el (0,0) DCT valor es el promedio de todo el bloque], y cuanto más lejos de esa esquina que usted consigue, más "alta frecuencia" de los detalles que vas a conseguir.Cuanto más cerca de la parte superior e izquierda de la imagen, más horizontal y vertical de los detalles que tendrá representado por ese coeficiente DCT, y más cerca de la diagonal de la cuadra, el más diagonal detalles tendrás.

En breve, la compresión con pérdida general implica tirar algunos de los "detalles" que pueden no ser perceptibles para el ojo.(Tirar el "más suave" DCT valores resulta en distorsión severa.) El más DCT valores de distancia, mayor es su relación de compresión, sino también, la mayor distorsión que va a inducir.

Como para el tamaño de bloque, todo depende.El más varianza y el detalle no está en un bloque, el más usted perderá por tirar de los coeficientes.Algunos de los algoritmos de compresión de forma adaptativa en el uso de diferentes tamaños de bloque dentro de la misma imagen, de manera que gran detalle las regiones de recibir más y más pequeños bloques y suave a las regiones menos y bloques más grandes.

Para los algoritmos que utilizan un único tamaño de bloque de 8x8, 16x16 y 32x32 son comunes para cosas como JPEG y MPEG.El procesamiento necesario para comprimir ellos será más pequeño que una adaptación del tamaño del bloque, pero la calidad también será menor en general.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow