سؤال

لقد نظرت قليلاً إلى الاعتراف بالوجه مؤخرًا. ومع ذلك ، فأنا أشعر بالملاحظة بعدد الخوارزمية.

PCA ، LDA ، IDA ، Wavelets Gabor ، AAM ...

قل أنك تريد أن تصنع شيئًا مثل هذه... ما هي الخوارزميات التي ستستخدمها أو الأوراق التي تقرأها؟

هل كانت مفيدة؟

المحلول

أعتقد أن أول شيء يجب عليك فعله هو إدراك أن الخوارزميات التي أدرجتها تستخدم في مراحل مختلفة من التعرف على الوجه.

أولاً ، تحتاج إلى اتخاذ قرار بشأن التمثيل ، أي الميزات المراد استخدامها. هذه يمكن أن تكون وحدات البكسل الخام ، مرشحات gabor ، نوع من واصفات الشكل ، نماذج قابلة للتشوه ، إلخ.

بعد ذلك ، تريد عادةً تقليل أبعاد ميزاتك. هذا هو المكان الذي تأتي فيه الخوارزميات مثل PCA أو ICA أو LDA ، والتي تشير بيانات المشروع إلى مساحة منخفضة الأبعاد تحاول الحفاظ على معظم التباين (PCA) أو لضمان الفصل الأمثل للنقاط في الفئات المختلفة (LDA).

ثم ربما ترغب في تدريب مصنف على ميزاتك للتمييز بين وجوه الأشخاص المختلفين. هناك عدد كبير من الخوارزميات للاختيار من هنا ، مثل أقرب جار ، ودعم آلات المتجهات ، ونماذج ماركوف المخفية ، وشبكات بايز ، إلخ.

لاحظ أن اختيار الخوارزمية لمرحلة معينة قد يعتمد أو لا يعتمد على الخوارزميات للمراحل الأخرى. بالنسبة للحالات ، يمكن استخدام PCA لتقليل أبعاد أي نوع من الميزات تقريبًا. من ناحية أخرى ، ليس من الواضح على الفور كيف يمكن للمرء استخدام مصنف لآلة ناقلات الدعم للوجوه التي يمثلها شبكة مشوهة.

أعتقد أن أول شيء يجب أن تحاول القيام به هو تحديد مشكلتك بدقة شديدة. هل تريد التمييز بين وجوه عدد قليل من الأشخاص فقط ، مثل التعرف على أفراد عائلتك في الصور؟ هل تريد التعرف على أشخاص من قاعدة بيانات ضخمة؟ هل لديك الكثير من الصور التدريبية لكل وجه ، أو عدد قليل فقط؟ هل تريد التعامل مع التوجهات المختلفة وظروف الإضاءة؟

تحدد الإجابات على هذه الأسئلة مدى تعقيد مشكلتك ، وستؤثر بالتأكيد على اختيارك للخوارزميات.

تحرير: ها هو أ فرضية من شخص حاول حل مشكلة مماثلة. إنه من عام 2002 ، ولكن Imho هو مكان جيد للبدء.

نصائح أخرى

تريد النظر في خرائط العمق. هذا هو أحدث الفن. حاول أن تقرأ عن التمثيلات الكروية المتفرقة. وجوه Eigen ليست قوية للغاية. انها ليست ثابتة لعدة عوامل. يستخدم التعرف على الوجه الفني 3D PCL الذي يحتوي على معلومات عمق. هذا من شأنه أن يسمح لك بالتعرف حتى في الظلام. يمكنك استخدام كاميرا ASUS أو كاميرا Kinect لجمع معلومات العمق. امل ان يساعد!

Haar Cascade يركض على ميناء Marilena.

تتالي Haar هي خوارزمية تقرأ ملفًا وتخبر الكمبيوتر كيف يبدو شيء ما. لقد استخدمته في الماضي لاكتشاف الوجوه والنظارات والابتسامة واليدين وعلب فحم الكوك.

http://en.wikipedia.org/wiki/haar-like_features

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top