Frage

Ich habe zwei Verzeichnisse mit ~20 GB Musik-Dateien (meist mp3, ogg einige), und ich möchte erkennen, alle doppelten songs.Es gibt zwei komplizierenden Faktoren:

  1. Ein Lied kann verschiedene Dateinamen in den beiden Verzeichnissen.
  2. Zwei Dateien mit dem gleichen Lied kann haben verschiedene ID3-tags und damit verschiedene Prüfsummen.

Was ist ein guter Ansatz, um dies zu lösen?

War es hilfreich?

Lösung

So wie ich über diesen in der Vergangenheit gegangen ist genpuids zu verwenden, die von Musik IP kommen. Die Closed-Source-Software erstellt eine Audio-Fingerabdruck einer Datei unabhängig von Format, id3, Prüfsumme usw.

Weitere Information finden Sie hier .

Dies sollte die meisten Mengen positiver doppelte Übereinstimmungen gewährleisten und Fehlalarme minimieren. Es kann auch eine falsche ID3-Tags korrekt etikettieren.

Andere Tipps

Hier ist, was würde ich tun (oder getan haben)...

  1. Laden Sie alle songs auf itunes (Bär mit mir) (beachten Sie, wenn Sie itunes verwenden, hier, dann halt ...Ich nehme an, Ihre Liste der betrogene ist lang und unhandlich)
  2. Löschen Sie alle songs, sendet Sie an den Papierkorb, so dass Sie loszuwerden, die directory-Struktur
  3. Natürlich nicht "Papierkorb leeren".Retten Sie die songs in einen Ordner auf Ihrem desktop
  4. Verwenden Sie software wie mediamonkey, dupe eliminator oder auch itunes selbst Duplikate zu identifizieren.Dupe eliminator ist gut, dass es überprüft, indem Sie eine unterschiedliche Anzahl von Faktoren, artist, Länge, Größe und so weiter und Vermutungen, was ist ein dupe ist, und was nicht)
  5. Reload auf Itunes, diese Zeit, um prüfen "Automatisch anordnen songs", die werden lassen Sie Ihre neue, dupeless Liste auf ein nettes by-artist-by-arrangement album

...voila!(oder, wenn Sie Lesen, digg:"...Gewinn!")

/mp

Wenn Sie eine Bibliothek haben, die die Dateien analysieren kann, können Sie den Hash auf die Audiodaten ausgeführt werden. Dies wird Ihnen nicht helfen, wenn der Song ein anderes rip ist oder werden erneut komprimiert / umcodiert / etc.

Sind die ID3 / OGG-equiv Künstler und Song Metatags genau? Wenn sie sind, könnten Sie verwenden diese.

Edit: Wenn sie es nicht sind, vielleicht könnten sie sein gemacht werden ... Wenn Sie nur mit ganzen Alben zu tun sind, gibt es mehrere Tools, die alle Tag-Daten basierend auf der Anzahl von Spuren erhalten werden und ihre Längen.

Wenn Sie mit Mixen von Alben und einzelnen Dateien zu tun hat, wird es komplizierter.

Ich bin sicher, dass es elegantere Lösungen gibt - aber wenn die Audiodaten äquivalent ist, dann Strippen der ID3-Tags und Hashing sollte es tun. Nach Hashing, können Sie die ID3-Tags zurück setzen, wenn Sie möchten.

Vielleicht ist das Last.fm API würde nützlich sein. Es enthält einen track.getInfo Aufruf, die XML zurückgibt, einschließlich der Länge der Strecke, Künstlername, Titelnummer, etc. Sie konnten Spuren vergleichen und sehen, ob sie mehr als N Felder gleich und wenn ja haben, übernehmen sie die gleichen Weg sind.

Ich habe keine Ahnung, ob sie gehen in Ordnung zu sein mit Ihnen API-Anfragen für 40GB von Musik einreichen, though.

Wie wäre es etwa so: eine Bibliothek die MP3-Dateien Länge sowie einen Zeiger auf die Audiodaten zu erhalten (sieht aus wie es ein paar Bibliotheken gibt, die dies tun können), einen ersten Passfilter tun basierend auf Song Längen und für die Songs, die passenden Längen Prüfsumme ihre Audiodaten haben. Ähnlich wie diese

Einige Anpassung von ffTES hat für mich eine sehr ähnliche Aufgabe hat gut funktioniert.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top