كيف تقارن كلمة منطوقة بملف صوتي؟
-
27-09-2019 - |
سؤال
كيف يمكنك مقارنة كلمة منطوقة بملف صوتي وتحديد ما إذا كانت متطابقة؟ على سبيل المثال ، إذا قلت "Apple" لتطبيق iPhone الخاص بي ، أود أن يسجل الصوت ومقارنته بملف صوتي مسجل مسبقًا لشخص يقول "Apple". يجب أن تكون قادرة على تحديد أن الكلمتين المنطقيتين تتطابقان.
ما نوع الخوارزمية أو المكتبة التي يمكنني استخدامها لأداء هذا النوع من مطابقة ملفات الصوت القائمة على الصوت؟
المحلول
Sphinx يقوم بالتعرف على الصوت وتم نقل الجيوبسفينكس إلى iPhone بواسطة براين كينج
التحقق من https://github.com/kingofbrian/vocalkit
لقد قدم تفاصيل ممتازة وجعل من السهل تنفيذها بنفسك. لقد قمت بتشغيل مثاله وتعديل تسليمه الخاص به.
نصائح أخرى
يجب أن تبحث عن بصمة صوتية انظر رابط ويكيبيديا أدناه. Shazam يفعل ذلك بشكل أساسي للموسيقى.
أعلم أن هذا السؤال قديم ، لكنني اكتشفت هذه المكتبة اليوم:
يمكنك استخدام مكتبة الشبكات العصبية وتعليمها التعرف على أنماط الكلام المختلفة. سيتطلب ذلك البعض يعرف كيف وراء النظرية العامة للشبكات العصبية وكيف يمكن استخدامها لإنشاء أنظمة تتصرف بطريقة معينة. إذا لم تكن تعرف شيئًا عن الموضوع ، فيمكنك البدء في الأساسيات فقط ثم استخدام مكتبة بدلاً من تنفيذ شيء بنفسك. امل ان يساعد.