Pregunta

¿cómo puedo crear una suma de comprobación de sólo los datos multimedia sin los metadatos para obtener una identificación estable para un archivo multimedia. preferiblemente un enfoque de plataforma cruzada con una biblioteca que tiene soporte para muchos formatos. p.ej. VLC, ffmpeg o mplayer.

(archivos multimedia deben estar audio y vídeo en los formatos más comunes, las imágenes sería bueno tener también)

¿Fue útil?

Solución

No sé de ningún software independiente de la plataforma existente que va a lograr esto, pero sí sé una manera que esto podría lograrse en un lenguaje interpretado (independiente de la plataforma) como Java.

En esencia, simplemente necesitamos para despojar a los metadatos (etiquetas) del archivo, demultiplexar archivos de vídeo de antemano. Teóricamente después de demux y la eliminación de metadatos, se puede desmenuzar el archivo y compararlo con otro archivo que ha sufrido el mismo proceso para que coincida con los archivos idénticos a pesar de tener diferentes etiquetas. A diferencia de una huella digital, esto no sería identificar canciones similares / películas, pero los archivos idénticos (imagina es posible que desee las 10 versiones diferentes tasas de bits o de una canción determinada que ha archivado, pero no quiere 2 copias idénticas de cualquiera de ellos flotando) .

La parte más preocupante de esta es la eliminación de las etiquetas, ya que hay muchas especificaciones diferentes para formatos de etiquetas que no están necesariamente implementadas de la misma a través de diferentes aplicaciones, es decir, el mismo archivo de audio exacta dada etiquetas idénticas separado a través de dos aplicaciones diferentes puede no resultar en archivos de salida idénticas. La única manera que esto podría plantear un problema fatal para el concepto de una suma de comprobación de sólo audio es si el software de etiquetado populares hace que cualquier cambio en la parte de audio binaria del archivo, o almohadillas el audio de un modo no estándar.

Tomar una suma de comprobación es trivial, pero no estoy al tanto de la parte superior de mi cabeza cualquier bibliotecas independientes de la plataforma y demultiplexar archivos MPEG detag. Sé que en 'ambientes nix, mpgtx es una gran herramienta de línea de comandos que podría realizar el demux y detag, pero obviamente eso no es una solución independiente de la plataforma.

Tal vez alguien por ahí se siente ambicioso?

Otros consejos

Una posible solución he encontrado parece estar relacionado con VLC:

./VLC -I rc snd.mp3 :sout='#std{mux=raw,access=file,dst=-}' vlc://quit | sha1sum
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top