سؤال

لقد حصلت على اثنين من الدلائل التي تحتوي ~20 GB من ملفات الموسيقى (في الغالب mp3, بعض ogg), و أود أن الكشف عن جميع الأغاني المكررة.هناك نوعان من العوامل المعقدة:

  1. أغنية قد تختلف أسماء الملفات في الدلائل.
  2. اثنين من الملفات التي تحتوي على نفس الأغنية قد تختلف علامات ID3 وبالتالي يكون مختلف اختبارية.

ما هو نهج جيد في حل هذا ؟

هل كانت مفيدة؟

المحلول

الطريقة التي كنت قد ذهبت عن هذا في الماضي هو استخدام genpuids التي تأتي من الموسيقى الملكية الفكرية.مغلقة المصدر يخلق بصمة الصوت من ملف بغض النظر عن الشكل ، id3, الاختباري.... الخ

مزيد من المعلومات يمكن العثور عليها هنا.

يجب أن يضمن اكبر قدر من الإيجابية مكررة مباريات والتقليل من ايجابيات كاذبة.فإنه يمكن أيضا بشكل صحيح الوسم غير صحيحة علامات id3.

نصائح أخرى

وهنا ما أود أن تفعل (أو قد فعلت من قبل)...

  1. تحميل جميع الأغاني على اي تيونز (تحملوني) (ملاحظة, إذا كان يمكنك استخدام اي تيونز هنا ، ثم توقف ...أفترض قائمة المغفلين طويلة لا يمكن السيطرة عليها)
  2. حذف جميع الأغاني إرسالها إلى سلة المهملات ، وبهذه الطريقة يمكنك التخلص من بنية الدليل
  3. ومن الواضح أن لا "إفراغ سلة المهملات".الإنقاذ الأغاني إلى مجلد على سطح المكتب الخاص بك
  4. استخدام البرمجيات مثل ميديامونكي, خداع eliminator أو حتى اي تيونز نفسها لتحديد التكرارات.خداع المزيل هو جيد في هذا الأمر يتحقق من خلال كمية متفاوتة من العوامل, الفنان, طول, حجم الملف وغيرها التخمينات ما هو مغفل وما هو ليس كذلك)
  5. تحديث على اي تيونز ، هذه المرة الاختيار "تلقائي ترتيب الأغاني" ، والتي سوف تسقط الجديد الخاص بك ، dupeless قائمة على لطيفة من قبل-الفنان-من ألبوم الترتيب

...فويلا!(أو إذا كنت تقرأ digg:"...الربح!")

/mp

إذا كان لديك مكتبة يمكن تحليل الملفات ، يمكنك تشغيل على تجزئة البيانات الصوتية.هذا لن يساعدك إذا كانت الأغنية مختلفة مزق أو قد يكون الذي أوصت ضغط/المحولة/الخ.

هي ID3/OGG-equiv أغنية الفنان إشارات مرجعية دقيقة ؟ إذا هم يمكن استخدام هذه.

تحرير:إذا لم تكن, ربما أنها يمكن أن تكون...إذا كنت تتعامل فقط مع ألبومات كاملة ، وهناك العديد من الأدوات التي سوف تحصل على كل الوسم البيانات استنادا إلى عدد من المسارات أطوالها.

إذا كنت تتعامل مع خلطات ألبومات و الملفات واحد ، فإنه يحصل على أكثر تعقيدا.

أنا متأكد من أن هناك أكثر أناقة الحلول هناك - ولكن إذا كان الصوت البيانات ما يعادلها ، ثم تجريد علامات ID3 و تجزئة ينبغي أن تفعل خدعة.بعد تجزئة يمكنك وضع علامات ID3 مرة أخرى إذا أردت.

ولعل الماضي.fm API قد يكون من المفيد.ويشمل المسار.getInfo الاتصال والتي ترجع XML بما في ذلك المسار طول اسم الفنان, تتبع رقم.... الخهل يمكن مقارنة المسارات ومعرفة ما إذا كان لديهم أكثر من ن حقول متساوية وإذا كان الأمر كذلك ، نفترض انهم نفس المسار.

ليس لدي أي فكرة حول ما إذا كان انهم ذاهبون ليكون معك في تقديم طلبات API من أجل 40gb من الموسيقى, على الرغم من.

ماذا عن شيء مثل هذا:تجد المكتبة للحصول على mp3 طول وكذلك مؤشر إلى البيانات الصوتية (يبدو أن هناك بعض المكتبات هناك التي يمكن أن تفعل هذا) ، لا أول مرشح تمرير استنادا إلى أغنية الأطوال و الأغاني التي لديك مطابقة أطوال المجموع الاختباري الصوت البيانات.مشابهة لهذه سيناريو إيجاد الملفات المكررة / صور.

بعض التكيف ffTES عمل رائع بالنسبة لي جدا مهمة مماثلة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top