Frage

Meine große (120gb) Musik-Sammlung enthält viele doppelten Lieder, und ich habe in der Hoffnung, Erkennung von Duplikaten zu Fingerabdruckspuren versucht. Und da ich bin ein CS-Dur ich sehr neugierig bin, was dort geschieht, aus? Nichts, was ich tun hat fast die Genauigkeit der so etwas wie Shazam oder Lala.com. Wie tun sie „hash“ Spuren? Ich habe einen Standard-MD5-Hash auf all meine Dateien (26.000 Dateien) laufen und ich Hunderte von gleich Hashes auf verschiedene Spuren gefunden, so das nicht funktioniert.

Ich bin mehr daran interessiert, in Lala.com, da sie mit vollen Dateien arbeiten, im Gegensatz zu Shazam, aber ich gehe davon aus beide verwendet eine ähnliche Technik. Kann mir jemand erklären, wie eindeutige Kennungen für die Musik zu generieren?

War es hilfreich?

Lösung

Die wegweisende Arbeit auf Audio-Fingerprinting ist die Arbeit von Haitsma und Kalker in den Jahren 2002-03. Für jeden Rahmen von Audio-, vorverarbeitet es (Unterschiede zwischen dem Zeitrahmen und Frequenzbänder) und speichert dann eine binarisierte Version des Spektrums des Rahmens.

Dieses Verfahren fügt Robustheit. Wenn das gesamte Signal in der Zeit verschoben ist, es funktioniert immer noch (zumindest, kann man eine niedrigere ableiten auf Leistungsverschlechterung gebunden). Es ist ziemlich robust gegenüber Umgebungslärm. Seit seiner Gründung hat es viele Papiere auf Low-Level-Musik Ähnlichkeit gewesen, so gibt es keine einfache Antwort.

Haben Sie absolut identische Dateien haben, das heißt, die Signale werden zeitlich ausgerichtet ist Bittiefe die gleiche, Abtastrate ist gleich? Dann würde ich denken, ein Hash wie MD5 funktionieren soll. Aber wenn einer dieser Parameter geändert werden, so wird den Hashes. In einem solchen Fall erwähnt ein Verfahren wie das früher besser funktionieren würde.

Werfen Sie einen Blick auf die IZMIR Verfahren frei im Internet verfügbar. Lustige Sachen. http://www.ismir.net/

Andere Tipps

Es gibt eine Menge von Algorithmen zur akustischen Fingerabdrucks. Einige der beliebtesten sind:

  1. AMG LASSO
  2. AudioID
  3. LibFooID

In der Tat ist libfooId Open Source, so dass man seinen Code in Google-Code überprüfen kann !!

Hier finden Sie aktuelle er Acoustic Fingerprint Seite auf Wikipedia. Es hat Referenzen für einige Papiere sowie Links zu Implementierungen (einschließlich der Open-Source- fdmf ).

Nach einigen mehr Forschung (!, Obwohl dies gar nicht schlüssig ist), ich über das Wiki passiert bei MusicBrainz.org, die einige der Details erreicht sie verwenden:

http://musicbrainz.org/doc/Audio_Fingerprint

http://musicbrainz.org/doc/How_PUIDs_Work

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top