質問

私はずっとそう、これはあなたの一部には明らかであり圧縮アルゴリズムで働いていないので、

患者う。いくつかのストリーミングビデオが遅れ始めると、私はいつも何か気づきました。私はこの質問を見ているときに私は興味があった実現します:

Twitterの画像符号化チャレンジする

私は、画素そのものではなく、圧縮した結果のレイアウトのようなグリッドの話ではありません。この指標アルゴリズムや技術のどのようなのですか?あなたはそれについて私に伝えることができますか?

役に立ちましたか?

解決

MPEG-2 の上、このWikipediaの記事を見てみましょう。その一部を引用すると:

  

簡単に述べると、生フレームは8つの画素ブロックを8画素に分割されています。各ブロック内データは、離散コサイン変換によって変換されます。結果は、係数の8×8行列です。変換周波数変動に空間的な変動を変換するが、それは、ブロック内の情報を変更しません。元のブロックは、逆コサイン変換を適用することによって正確に再現することができる。

言い換えれば、あなたが見る格子状構造は、ピクセルの8×8ブロックに適用されるこのDCTの直接的な効果である。

他のヒント

ブロックの理論的根拠は、位置/周波数トレードオフに連結されています。画像は、スペクトル領域で圧縮前のブロックに分割される( DCT の)アーチファクトよう圧縮により、より局在化しています。標準JPEGでは、ブロックは、画像全体に一定のサイズのものです。 JPEG2000のようなより最近の形式については、ブロックは、ウェーブレットを使用して、画像に適用されます。私は、ビデオフォーマットの詳細に精通していないですが、根拠は同じです。

これは、オーディオ符号化(mp3)についても同様の現象である。全体ではなく、音声ファイルにスペクトルを計算するには、(44.1 kHzの信号のため、一般的に数百)少数サンプルのいくつかのセクションにファイルを分割します。圧縮されたデータ(ネットワーク、破損したファイル)の破損がある場合と同様に、あなたは行方不明の窓に起因しているノイズを聞くことができます。

これはマクロブロッキングに呼ばれています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top