اللغة المستخدمة لكتابة برنامج التعرف على الكلام؟

https://stackoverflow.com/questions/664984

21-08-2019
|

سؤال

وأريد أن أكتب برنامج التعرف على الكلام الأساسية التي يمكن تحويل الكلام إلى نص. أردت أن أعرف اللغة التي هي الأكثر ملاءمة لكتابة مثل هذا البرنامج. وجافا مناسبة لهذه الوظيفة؟

وتحرير: شكرا لكم جميعا على الردود. اريد بناء أداة لمشروع الكلية. أنا لا أريد أن أكتب من الصفر. فقط أريد أن التجريبي قوة التعرف على الكلام. الأداة يجب أن مجرد كتابة كل ما يقوله مستخدم على محرر نصوص مثل المفكرة. ليس من الضروري أن يكون دقيقا جدا. أريد فقط أن تجربه والتعلم خوارزميات مختلفة وراء التعرف على الكلام كما أجد هذا المجال مثيرة جدا للاهتمام.

وشكرا لكم، ديباك

المحلول

وجاوة قد تكون مناسبة لواجهة لذلك، ولكن التعرف على الكلام يتطلب الناخر الخام على محمل الجد. سأكون اختيار جمعت لغة قريبة إلى لالمعادن مثل C للمحرك الاعتراف الفعلي.

وهذا ليس شيئا الواجب اتخاذها على محمل الجد، بالمناسبة. هناك عدد ضخم من نظرية ستحتاج إلى تعلم حتى قبل أن تبدأ. نفسي، وأود أن ترخيص واحد من المحركات الحالية إن أمكن، والتركيز على بناء منتج لائق حوله.

وهذا إذا كان القصد الخاص هو بناء المنتج. إذا كنت ترغب فقط في تجربة، وبكل الوسائل الكتابة الخاصة بك. أنه سوف يكون متعة (إلى حد ما: -).

نصائح أخرى

وطلابي يستخدمون أبو الهول . هو مكتوب في جاوة (ميناء من C ++ أعتقد). قد لا تكون مناسبة لما تريد (أعتقد أنك سوف تحتاج إلى إنشاء القاموس الخاص بك) ولكن تستحق التدقيق بها.

وأنا أتفق مع باكس أن هذا هو المحتمل جدا مشروع كبير، وأن الحل الأكثر عملية هو على الارجح لمجرد ترخيص محركا القائمة.

إذا نطاق ما تريد القيام به هو مجرد <م> تمييز بين عدد قليل من الكلام الممكنة المعروفة سابقا، انها مشروع أصغر بكثير، ولكن لا تزال كبيرة.

ولكن ... إذا قررت أنك حقا حقا حقا لا تريد للبدء في تطوير بنفسك، لا استطيع ان ارى سببا لعدم استخدام جافا. فكرة أن "C أسرع" هو إلى حد كبير أسطورة (أو على أساس الخروج من تاريخ المعلومات).

وويتفق مع كل شيء تقريبا وقال باكس، لذلك أنا ذاهب لتكون مناقضة ويقول لعكس ذلك. الحكمة التقليدية هي أن التعرف على الكلام "يتطلب الناخر الخام على محمل الجد"، وأنه قد يكون بسبب هذا صحيح.

ولكن أيضا قد يكون أن يعتقد الجميع أنه بسبب هذه هي الطريقة التي كانت دائما القيام به. معتبرة من حقيقة أن الدماغ البشري <م> لا لا كميات هائلة من البيانات القوة الغاشمة متماوج على تمييز الكلام، أود أن أقترح أن توجد ذكية خوارزميات استخراج ميزة للقيام بهذه المهمة <م> كثير أكثر كفاءة.

إذا كان هذا هو الحال، وإذا كنت تسعى إلى إيجاد مثل خوارزمية، وهي لغة عالية المستوى قد يكون أكثر ملاءمة لهذه المهمة. أي شيء يخسره في كفاءة عليك المكياج وأكثر في التعبير حسابي.

وقال ذلك، كان على حق على الارجح.

وأعتقد أن جافا يمكن أن يكون خيارا جيدا، كل هذا يتوقف على كيفية ظهور الإدخال. هناك بعض المكتبة لطيفة للأصوات في جاوة.

واللغة لن تكون مشكلة لأنها ستكون مسألة الاعتراف الأنماط. إذا جافا هي اللغة التي هي الأكثر دراية، وأود أن استخدامها.

تورينج كاملة بحيث يمكن التعامل مع كل وظيفة البرمجة. سواء كنت <م> تريد أن تفعل شيئا في جاوة هو تماما متروك لكم.

وكان لدينا نجاحا معتدلا مع الإطار Shynx مكتوب بلغة جافا، ولكن يكمن العمل الشاق الحقيقي في فهم الخوارزميات والرياضيات المعنية في المنطقة ومن ثم في محرك ضبط لتلبية الاحتياجات الخاصة بك.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow