سؤال

أنا جديد في عالم الصوت، وتم تكليفي بمهمة لست متأكدًا من كيفية التعامل معها.أحتاج إلى عرض رسم بياني يمثل درجة ملف WAV.يمكن أن يكون ملف WAV متعدد الألحان، وبعد ذلك أحتاج إلى عرض الرسم البياني لطبقة الصوت المهيمن (اقرأ:بأقوى صوت) الآلة (أو الغناء بصوت الإنسان).أنا على دراية تامة بـ .NET، ولا أعرف شيئًا تقريبًا عن لغة C وC++ وJava.

لقد بدأت بحثًا على الويب، ومن ما فهمته، فإن اكتشاف درجة الصوت لملفات WAV متعددة الألحان يمثل مشكلة لم يتم حلها، لكنني لا أحتاج إلى درجة الصوت الدقيقة، فقط لمعرفة ما إذا كانت أعلى من الدرجة التالية، وما هو حجمها طول.

أسئلتي هي:

  1. أين يجب أن أبدأ في تعلم النظرية الكامنة وراء هذه المهمة؟هل هناك أي كتب ينصح بها لذلك؟

  2. هل هناك أي API/أداة يمكنها القيام بذلك؟

شكرًا،

مل

هل كانت مفيدة؟

المحلول

يمكنك استخدام تحليل فورييه لاستخراج الترددات المكونة للموجة.إليك سؤال SO ذي الصلة: تحويل فورييه السريع في C#

نصائح أخرى

لقد بدأت في معالجة الإشارات مع معالجة الإشاراة الرقمية.يمكنك شراء الكتاب المطبوع بحوالي 30 دولارًا، أو تنزيله بصيغة pdf مجانًا.إنه مكتوب لغير العلماء، ويحتوي على قدر كبير من المعلومات لمساعدتك في التعامل مع تقنيات معالجة الإشارات المختلفة.

سوف يقوم FFT (تحويلات فورييه السريعة) بتحويل إشارة الوقت مقابل السعة إلى تردد (صناديق) مقابل الكثافة (الطاقة).يمكنك الانتقال من التردد إلى الملاحظة عبر المخططات القياسية وجدت على الكثير من المواقع.

لقد كنت أعمل في مشروع ذي صلة إلى حد ما.ستحتاج إلى التحقق من تحويلات فورييه السريعة.يمكنني أن أوصي بهذا مشروع مكتوب بلغة C# - إنه مكتوب على شكل موالف جيتار ولكن يمكن تعديله بسهولة ليناسب غرضك.

لكن هذا لن يفعل تعدد الملاعب.يوجد منتج اسمه "احتفال" والتي تدعي أن لديها هذه القدرة باستخدام "الوصول المباشر للملاحظات (DNA)".التكنولوجيا الخاصة بهم مغلقة المصدر بشكل مفهوم، ولكن قد تتمكن من ترخيصها بالسعر المناسب.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top