سؤال

كيف يمكنك مقارنة كلمة منطوقة بملف صوتي وتحديد ما إذا كانت متطابقة؟ على سبيل المثال ، إذا قلت "Apple" لتطبيق iPhone الخاص بي ، أود أن يسجل الصوت ومقارنته بملف صوتي مسجل مسبقًا لشخص يقول "Apple". يجب أن تكون قادرة على تحديد أن الكلمتين المنطقيتين تتطابقان.

ما نوع الخوارزمية أو المكتبة التي يمكنني استخدامها لأداء هذا النوع من مطابقة ملفات الصوت القائمة على الصوت؟

هل كانت مفيدة؟

المحلول

Sphinx يقوم بالتعرف على الصوت وتم نقل الجيوبسفينكس إلى iPhone بواسطة براين كينج

التحقق من https://github.com/kingofbrian/vocalkit

لقد قدم تفاصيل ممتازة وجعل من السهل تنفيذها بنفسك. لقد قمت بتشغيل مثاله وتعديل تسليمه الخاص به.

نصائح أخرى

يجب أن تبحث عن بصمة صوتية انظر رابط ويكيبيديا أدناه. Shazam يفعل ذلك بشكل أساسي للموسيقى.

http://en.wikipedia.org/wiki/acoustic_fingerprint

أعلم أن هذا السؤال قديم ، لكنني اكتشفت هذه المكتبة اليوم:

http://www.ispikit.com/

يمكنك استخدام مكتبة الشبكات العصبية وتعليمها التعرف على أنماط الكلام المختلفة. سيتطلب ذلك البعض يعرف كيف وراء النظرية العامة للشبكات العصبية وكيف يمكن استخدامها لإنشاء أنظمة تتصرف بطريقة معينة. إذا لم تكن تعرف شيئًا عن الموضوع ، فيمكنك البدء في الأساسيات فقط ثم استخدام مكتبة بدلاً من تنفيذ شيء بنفسك. امل ان يساعد.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top