Domanda

Sto cercando di capire l'effetto della dimensione del blocco e la migliore strategia di scegliere i coefficienti in compressione DCT. Fondamentalmente io voglio chiedere quello che ho scritto qui:

compressione video:? Cosa è trasformata coseno discreta

Consente di assumere la compressione più primitivo. Facendo blocco di un'immagine. L'esecuzione di una DCT su ogni blog e azzeramento dei coefficienti.

Per la mia comprensione, il più piccolo è il blocco, meglio è. blocchi più piccoli si intendono i pixel sono più correlato quindi l'energia nello spettro DCT è più "compatto". Dovrebbe essere più accentuato in immagini in rapido variabili (ad alta frequenza).

Diciamo che abbiamo azzerare una certa percentuale dei coefficienti, che cosa si tradurrebbe in una migliore qualità dell'immagine, piccole o grandi blocchi? Diciamo che teniamo, 10%, 25%, 50%, 75%, vuoi dire che è una risposta diversa per una percentuale diversa?

Un altro problema è come scegliere i coefficienti si lascia intatta. Per timore di dire che devo prendere una decisione in base alla posizione e non l'energia. Vuoi prendere una piazza dall'angolo in alto a sinistra? Ho una media di molti blocchi nello spettro DCT e ha concluso la migliore sarebbe prendere un triangolo dall'angolo in alto a sinistra. Cosa ne pensi?

Speriamo di avere la discussione efficace.

È stato utile?

Soluzione

L'essenza della tua domanda sembra essere sulla qualità delle immagini. C'è stata una notevole letteratura prodotta sull'argomento, e il risultato è che la qualità delle immagini è una cosa difficile da determinare.

misure errore matematico standard come il rapporto segnale-rumore (SNR) e l'errore quadratico medio (MSE) può dare una risposta quantitativa, ma è ben noto che questi non correlano bene con le opinioni soggettive spettatori, che deve essere la nostra autorità finale. Non ci sono altri metodi, anche quelle fondate su modelli psico-visiva dello spettatore (ad esempio, SA Karunasekera e NG Kingsbury, “Una misura di distorsione per bloccare gli artefatti nelle immagini sulla base di sensibilità visiva umana”, IEEE Trans. On Immagine Proc. Vol. 4 .., n ° 6, giugno 1995, pp 713 -724;... e M. Miyahara, K. Kotani, e VR Algazi, “scala di obiettivo di qualità dell'immagine (PQS) per la codifica delle immagini,” IEEE Trans su Comm vol 46, n. 9, settembre 1998, pp. 1215 -1226), hanno essi stessi dimostrato di essere meglio di SNR.

Inoltre, quando si varia il tipo di immagini (linea di disegno, fumetto, fotografia, ritratto, ecc), alcuni tipi di distorsione di compressione diventano più evidenti. rumore Mosquito potrebbe essere discutibile in una sola immagine, mentre il rumore scala potrebbe essere il colpevole in un altro.

In breve, non c'è pat risposta alla tua domanda, "che cosa si tradurrebbe in una migliore qualità dell'immagine?"

Detto questo, possiamo dire alcune cose circa il DCT che sono di pertinenza. I pixel in una DCT di un blocco vanno da basso a alto variazione variazione a zig-zag in alto a sinistra angolo [(0,0) -> (0,1) -> (1,0) -> (2 , 0) -> (1,1) -> (0,2) -> ecc], come i vostri triangolo specchi di selezione.. Il più vicino è quello di un pixel in alto a sinistra, il più agevole le informazioni ivi contenute [infatti, il (0,0) il valore DCT è la media di tutto il blocco], e il più lontano da quell'angolo si ottiene, più "alta frequenza" dettagli si otterrà. Il più vicino alla parte superiore e sinistra dell'immagine, dettagli più orizzontali e verticali avrai rappresentato da tale coefficiente DCT, e più vicino alla diagonale del blocco, i particolari più diagonali dovrete.

In breve, la compressione con perdita di solito comporta gettare via alcuni dei "dettagli" che potrebbero non essere percepibili all'occhio. (Gettare via i "più morbide" DCT valori si traduce in gravi distorsioni.) Quanto più DCT valori di buttare via, maggiore è il rapporto di compressione sarà, ma anche la maggiore distorsione ti indurre.

Per quanto riguarda la dimensione del blocco, tutto dipende. Quanto più varianza e dettagli v'è in un blocco, più si perde buttando via coefficienti. Alcuni algoritmi di compressione adattivo utilizzano blocchi di dimensioni diverse all'interno della stessa immagine in modo che le regioni di dettagli ricevono blocchi sempre più piccoli e regioni lisce ricevono meno e più grandi blocchi.

Per algoritmi che utilizzano una singola dimensione del blocco, 8x8, 16x16, 32x32 e sono comuni per cose come JPEG e MPEG. L'elaborazione necessaria per comprimere loro sarà più piccola di una dimensione di blocco di adattamento, ma la qualità sarà anche più basso in generale.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top