Question

Quelqu'un peut-il expliquer de façon claire et simple comment fonctionne MPEG4 pour compresser les données. Je suis surtout intéressé par vidéo. Je sais qu'il ya des normes différentes ou volets. Je suis en train de chercher la principale méthode de compression globale, s'il y a une MPEG4.

Était-ce utile?

La solution

MPEG-4 est une norme énorme, et emploie de nombreuses techniques pour atteindre les taux de compression élevés qu'il est capable de faire.

En général, la compression vidéo est préoccupé par jeter autant d'informations que possible tout en ayant un effet minimal sur l'expérience de visualisation pour un utilisateur final. Par exemple, en utilisant au lieu de sous-échantillonné YUV RVB réduit la taille de la vidéo dans la moitié tout de suite. Ceci est possible que l'oeil humain est moins sensible à la couleur que de la luminosité. En YUV, la valeur Y est la luminosité et les valeurs U et V représentent la couleur. Par conséquent, vous pouvez jeter une partie des informations de couleur qui réduit la taille du fichier, sans le spectateur remarquer aucune différence.

Après cela, la plupart des techniques de compression tirent profit de 2 licenciements en particulier. Le premier est la redondance temporelle et le second est la redondance spatiale.

redondance temporelle note que des trames successives d'une séquence vidéo sont très similaires. Généralement, une vidéo serait de l'ordre de 20-30 images par seconde, et rien beaucoup de changements dans 1/30 de seconde. Prenez tout DVD et mettre en pause, puis déplacez-le sur une image et notez la similitude des 2 images sont. Ainsi, au lieu de coder chaque trame de manière indépendante, MPEG-4 (et d'autres normes de compression) codent pour que la différence entre des trames successives (en utilisant estimation de mouvement pour trouver la différence entre les images)

La redondance spatiale profite du fait qu'en général, la propagation des couleurs sur les images ont tendance à être assez basse fréquence. Par là, je veux dire que les pixels voisins ont tendance à avoir des couleurs similaires. Par exemple, dans une image de vous porter un pull rouge, tous les pixels qui représentent votre cavalier aurait couleur très similaire. Il est possible d'utiliser le TCD pour transformer les valeurs de pixels dans l'espace de fréquence, où certaines informations à haute fréquence peut être jeté. Ensuite, lorsque le TCD est effectuée inverse (lors du décodage), l'image est maintenant sans jeter l'information à haute fréquence.

Pour voir les effets de jeter des informations de haute fréquence, ouvert MS peindre et dessiner une série de chevauchement des lignes noires horizontales et verticales. Enregistrez l'image au format JPEG (qui utilise également pour la compression TCD). Maintenant un zoom avant sur le motif, remarquez comment les bords des lignes ne sont pas aussi plus forte et sont un peu floues. En effet, certaines informations à haute fréquence (la transition du noir au blanc) a été jeté lors de la compression. Lire ceci pour une explication avec de belles images

Pour en savoir plus, ce livre est assez bon, si un peu lourd sur les mathématiques.

Autres conseils

Comme tout autre codec vidéo populaire, MPEG4 utilise une variation de transformée en cosinus discrète et variété de techniques compensation de mouvement (que vous pouvez penser que le mouvement de prédiction si cela aide) qui réduisent la quantité de données nécessaires pour les images suivantes. Cette page a une vue d'ensemble de ce qui est fait par MPEG4 ordinaire.

Il est pas tout à fait différente des techniques utilisées par les JPEG.

MPEG4 utilise une variété de techniques pour compresser la vidéo.

Si vous ne l'avez pas déjà regardé wikipedia, ce serait un bon point de départ .

Il y a aussi cet article de la IEEE qui explique ces techniques plus en détail.

Les arêtes vives certainement contiennent des hautes fréquences. La réduction ou l'élimination des hautes fréquences réduit la netteté des bords. Finesse des détails, y compris les arêtes vives est enlevé avec suppression haute fréquence - bilité de résoudre 2 petits objets est enlevé avec des fréquences élevées -. alors vous voyez juste un

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top