質問

私は、ブロックサイズとDCT圧縮の係数を選択する最善の戦略の効果を理解しようとしています。 基本的に私は、私がここに書いたものを聞きたい:

ビデオ圧縮:離散コサイン変換とは何ですか

は最も原始的な圧縮とさせて頂きます。画像のブロックを作ります。各ブログにDCTを実行し、いくつかの係数をゼロます。

私の理解するには、

、より良い小さいブロック。 小さなブロックは、画素がよりDCTスペクトルのエネルギーをより「コンパクト」であり、したがって相関していることを意味します。これは、より高速な変化の画像(高周波)で強調されなければならない。

私たちは、係数の一定の割合をゼロにしてみましょうと言う、最高の画質、小規模または大規模なブロックに何をもたらしますか? 我々は、10%、25%、50%、75%を維持するとしましょう、あなたはそれが異なる割合で異なる答えだと思いますか?

もう一つの問題は、あなたが手つかずのままの係数を選んだ方法です。 LESTのは、私は場所ではなく、エネルギーに基づいた意思決定をしなければならないと言います。 あなたは、左上隅からの正方形を取るだろうか? 私は、DCTスペクトルに多くのブロックを平均化し、最高の左上隅から三角形を取ることになると結論付けました。あなたはどう思いますか?

うまくいけば、我々は効果的な議論があるでしょう。

役に立ちましたか?

解決

あなたの質問の本質は、画像品質についてのようです。そこ被写体に生成かなりの文学となって、その結果は、画質が決定するのは難しいことだとされています。

は、信号対雑音比(SNR)と平均二乗誤差(MSE)のような標準的な数学エラー測定は、定量的な答えを与えることができ、同様にこれらの主観的視聴者の意見、と相関良くないことが知られています私たちの最終的な権限である必要があります。他の方法ない、でもそれらは、視聴者(例えば、SA KarunasekeraとNGキングスベリー、「人間の視覚感度に基づいて、画像内のアーティファクトを阻止するための歪み尺度」、IEEEトランス。画像のProc。巻の心理視覚的なモデルに設立しました。4 。なし6、1995年6月、頁713 -724; IEEEトランス「画像符号化のための客観的画質尺度(PQS)」とM.宮原、K.小谷、およびVR Algazi、Commの上の巻46、。。いいえ。9、1998年9月には、頁。1215 -1226)は、自身がSNRよりも優れていることが証明されている。

また、あなたは画像(線画、漫画、写真、肖像画など)の種類を変え、圧縮歪みの特定の種類は、より明白になります。階段ノイズが他に原因かもしれないしながら、モスキートノイズは、一つの画像内の好ましくない可能性があります。

要するに、あなたの質問へのパットの答えは、「最高の画質になるだろうか?」、ありません。

ということでは言っても、私たちは、関連性のあるDCTについてのいくつかのことを言うことができます。 >(0,1) - - >(1,0) - >(2左上[(0,0)からジグザグパターンで高い変動を低変化からブロック行くのDCTの画素、0) - >(1,1) - >(0,2) - >など]、あなたの三角形選択ミラーなど。近い画素は遠くあなたが得るそのコーナーから、情報がそこに含まスムーズに[実際には、(0,0)DCT値がブロック全体の平均である]左上隅にあり、そして、より多くの「高頻度」の詳細は、あなたが得られます。近いトップへと画像の左、より水平方向と垂直方向の詳細あなたは、近いブロックの対角にあなたが持っているだろうより多くの対角線の詳細をそのDCT係数によって表される、としているでしょう。

簡単に言うと、非可逆圧縮は、通常、目には知覚できない場合があり、「詳細」の一部を捨てることを伴います。 (深刻な歪みで「スムーズな」DCT値の結果を離れて投げる。)よりDCTは、あなたがより高いあなたの圧縮率がなる、捨てるだけでなく、より大きな歪みがあなたが誘発するだろう値ます。

はブロックサイズとしては、それはすべて依存しています。ブロックであり、より分散と詳細は、より多くのあなたは、係数を捨てることで失うことになります。その高ディテール領域は、より小さなブロックを受信し、平滑領域より少なく、より大きなブロックを受信するように、いくつかの圧縮アルゴリズムを適応的に同じ画像内の異なるブロックサイズを使用します。

単一ブロックサイズ、8×8、16×16、および32×32を使用するアルゴリズムは、

はJPEGやMPEGのようなもののために共通しています。処理は、それらは、適応ブロックサイズよりも小さくなる圧縮するのに必要な、しかし品質も一般的に低くなるであろう。

scroll top