DCT-Komprimierung - Blockgröße, Aussuchen Beiwerte

https://stackoverflow.com/questions/1955663

21-09-2019
|

Frage

Ich versuche, um die Wirkung der Blockgröße zu verstehen und beste Strategie der Koeffizienten in DCT-Kompression wählen. Im Grunde möchte ich fragen, was ich schrieb hier:

Video Compression: Was ist diskrete Cosinus-Transformation

Lässt die primitivste Kompression übernehmen. Herstellung Block eines Bildes. Durchführen einer DCT auf jedem Blog und einige Koeffizienten eliminierte.

Zu meinem Verständnis ist, desto kleiner desto besser ist der Block. Kleinere Blöcke Mittel die Pixel mehr damit die Energie in dem DCT-Spektrum korreliert sind, ist mehr „Compact“. Es sollte in einem schnell variierenden Bildern (High Frequency) mehr betont werden.

Lassen Sie uns sagen, dass wir einen bestimmten Prozentsatz der Koeffizienten Null aus, was in bester Bildqualität, kleine oder große Blöcke führen würde? Lassen Sie uns sagen, dass wir halten, 10%, 25%, 50%, 75%, würden Sie sagen, es für einen anderen Prozentsatz eine andere Antwort ist?

Ein weiteres Problem ist, wie die Koeffizienten wählen Sie unangetastet lassen. Aus Furcht, dass sagen, muss ich eine Entscheidung vor Ort und nicht die Energie basiert. Möchten Sie einen Platz von der linken oberen Ecke nehmen? Ich habe vielen Block in dem DCT-Spektrum gemittelt und schloss die besten ein Dreieck von der linken oberen Ecke nehmen würde. Was denken Sie?

Hoffentlich werden wir effektive Diskussion haben.

Lösung

Das Wesen Ihrer Frage scheint über die Bildqualität zu sein. Es gibt eine beträchtliche Literatur gewesen zu diesem Thema produzierte, und das Ergebnis ist, dass die Bildqualität eine harte Sache ist, zu bestimmen.

Standard mathematische Fehler Maßnahmen wie das Signal-zu-Rausch-Verhältnis (SNR) und mittlere quadratische Fehler (MSE) eine quantitative Antwort geben, aber es ist bekannt, dass diese nicht Korrelat auch mit subjektiven Betrachter Meinungen, die müssen unsere letzte Instanz sein. Keine andere Methoden, auch solche auf psycho-visuellen Modellen des Betrachters gegründet (zB SA Karunasekera und NG Kingsbury, „Eine Verzerrungsmaß für Artefakte in Bildern basierend auf menschliche visuelle Empfindlichkeit blockiert“, IEEE Trans. On Bild Proc. Vol. 4 , no 6, Juni 1995, S. 713 -724;..... und M. Miyahara, K. Kotani und VR Algazi, „Objective Bildqualitätsskala (PQS) zur Bildcodierung“, IEEE Trans on Comm vol 46, Nr. 9, September 1998, S.. 1215 -1226), hat sich bewährt besser als SNR sein.

Darüber hinaus, wenn Sie die Art von Bildern (Strichzeichnung, Karikatur, Foto, Porträt, etc.) variieren, bestimmte Arten von Kompressionsverzerrung werden deutlicher. Moskito-Rauschen könnte in einem Bild zu beanstanden sein, während Treppe Lärm könnte der Täter in einem anderen sein.

Kurz gesagt, gibt es keine pat Antwort auf Ihre Frage, „was in bester Bildqualität führen würde?“

That being said, können wir einige Dinge über die DCT sagen, die von Bedeutung sind. Die Pixel in einer DCT eines Block geht von niedriger zu hohen Variation Variation in einem Zick-Zack-Muster von der oberen linken Ecke [(0,0) -> (0,1) -> (1,0) -> (2 , 0) -> (1,1) -> (0,2) -> etc], als Dreieck Auswahl Spiegel.. Je näher ein Pixel an der oberen linken Ecke ist, desto glatter die darin enthaltenen Angaben [in der Tat, die (0,0) DCT-Wert der Mittelwert des gesamten Blocks ist], und je weiter weg von der Ecke man wird, desto mehr „Hochfrequenz“ Details Sie erhalten. Je näher an der oberen linken Ecke des Bildes, desto mehr horizontale und vertikale Details, die Sie durch die DCT-Koeffizienten dargestellt haben werden, und je näher an der Diagonalen des Blocks, desto mehr diagonal Details Sie haben.

Kurz gesagt, in der Regel verlustbehaftete Kompression bringt einige der „Details“, das nicht wahrnehmbar sein kann für das Auge Wegwerfen. (Werfen Sie die „weichere“ DCT-Werte führt zu einer starken Verzerrung weg.) Je mehr DCT Werte Sie wegzuwerfen, desto größer ist Ihre Kompressionsverhältnis wird, sondern auch die größere Verzerrung werden Sie induzieren.

Wie bei Blockgröße, es hängt alles. Je mehr Varianz und Detail dort in einem Block ist, desto mehr werden Sie durch das Wegwerfen Koeffizienten verlieren. Einige Kompressionsalgorithmen adaptiv verschiedene Blockgrößen innerhalb des gleichen Bildes verwenden, so dass High-Detail Regionen mehr und kleinere Blöcke erhalten und glatte Bereiche erhalten weniger und größere Blöcke.

Für Algorithmen, die eine einzelne Blockgröße verwenden, 8x8, 16x16 und 32x32 sind für Dinge wie JPEG und MPEG üblich. Die Verarbeitung erforderlich zu komprimieren sie kleiner als eine adaptive Blockgröße sein werden, aber die Qualität wird auch im Allgemeinen niedriger sein.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow