Compression TCD - Taille de bloc, le choix Coefficients

https://stackoverflow.com/questions/1955663

21-09-2019
|

Question

Je suis en train de comprendre l'effet de la taille de bloc et la meilleure stratégie de choisir les Coefficients en compression TCD. Fondamentalement, je veux demander ce que j'ai écrit ici:

Compression vidéo: Qu'est-ce que est transformée en cosinus discrète

laisse supposer la compression la plus primitive. Faire bloc d'une image. Réalisation d'une TCD sur chaque blog et mise à zéro des coefficients.

Pour ma compréhension, plus le bloc le mieux. blocs plus petits signifie que les pixels sont plus corrélés donc l'énergie dans le spectre DCT est plus « compact ». Il devrait être plus souligné dans une des images différentes rapide (haute fréquence).

Disons que nous zéro un certain pour cent des coefficients, ce qui aurait pour effet de la meilleure qualité d'image, petits ou grands blocs? Disons que nous gardons, 10%, 25%, 50%, 75%, diriez-vous qu'il est une réponse différente pour un pourcentage différent?

Une autre question est de savoir comment choisir les coefficients que vous laissez intact. De peur que de dire que je dois prendre une décision basée sur l'emplacement et pas d'énergie. Prendriez-vous une place dans le coin supérieur gauche? J'ai beaucoup fait la moyenne bloc dans le spectre TCD et concluais le meilleur serait prendre un triangle dans le coin supérieur gauche. Que pensez-vous?

Espérons que nous aurons des discussions fructueuses.

La solution

L'essence de votre question semble être sur la qualité de l'image. Il y a eu une littérature considérable produite sur le sujet, et le résultat est que la qualité d'image est une chose difficile à déterminer.

mesures d'erreur mathématique standard comme le rapport signal sur bruit (SNR) et l'erreur quadratique moyenne (MSE) peut donner une réponse quantitative, mais il est bien connu que ceux-ci ne sont pas bien corrélées avec les opinions des spectateurs subjectives, qui doit être notre autorité finale. Aucune autre méthode, même celles fondées sur des modèles psycho-visuels du spectateur (par exemple, SA Karunasekera et NG Kingsbury, « une mesure de distorsion pour bloquer des artefacts dans des images basées sur la sensibilité visuelle humaine », IEEE Trans. Sur l'image Proc. Vol. 4 .., n ° 6, Juin 1995, pp 713 -724,... et M. Miyahara, K. Kotani et VR Algazi, « image objective échelle de qualité (PQS) pour le codage de l'image, » Trans IEEE sur Comm vol 46, no. 9, septembre 1998, p. 1215 -1226), se sont révélés être mieux que SNR.

De plus, lorsque vous variez le type d'images (dessin au trait, bande dessinée, photo, portrait, etc.), certains types de distorsion de compression deviennent plus évidents. bruit de moustique pourrait être inacceptable dans une image, tandis que le bruit d'escalier pourrait être le coupable dans un autre.

En bref, il n'y a pas de réponse à votre question pat, « ce qui se traduirait par une meilleure qualité d'image? »

Cela étant dit, on peut dire certaines choses au sujet de la TCD qui sont pertinentes. Les pixels d'une DCT d'un bloc vont de la faible variation de variation élevée dans un motif en zig-zag de la [coin supérieur gauche (0,0) -> (0,1) -> (1,0) -> (2 , 0) -> (1,1) -> (0,2) -> etc.], comme les miroirs de sélection de triangle.. Plus un pixel est dans le coin supérieur gauche, le plus lisse les informations qui y sont contenues [en fait, le (0,0) valeur TCD est la moyenne du bloc entier], et plus loin de ce coin que vous obtenez, plus détails « de haute fréquence » vous obtiendrez. Les plus proches du haut et à gauche de l'image, les détails plus horizontales et verticales, vous aurez représenté par ce coefficient de TCD, et les plus proches de la diagonale du bloc, les détails plus diagonale vous aurez.

En bref, la compression avec perte implique généralement de jeter quelques-uns des « détails » qui peuvent ne pas être perceptible à l'œil. (Jeter les valeurs TCD résultats « plus lisses » dans une distorsion sévère.) Plus vous TCD valeurs jettes, plus votre taux de compression sera, mais aussi la plus grande distorsion vous allez induire.

En ce qui concerne la taille des blocs, tout dépend. Plus la variance et le détail il y a dans un bloc, plus vous perdrez en jetant des coefficients. Certains algorithmes de compression utilisent différentes tailles de façon adaptative bloc dans la même image afin que les régions de haute détail reçoivent de plus en plus petits blocs et régions lisses reçoivent des blocs moins et plus.

Pour les algorithmes qui utilisent une taille de bloc unique, 8x8, 16x16 et 32x32 sont communs pour des choses comme JPEG et MPEG. Le traitement nécessaire pour les compresser seront plus petits qu'une taille de bloc adaptatif, mais la qualité sera également plus faible en général.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow