ما هي مكتبة رؤية الكمبيوتر الجيدة للبيثون التي ستسمح لي لي بالعثور على وجوه في فيديو فلاش/HTML5؟

https://stackoverflow.com/questions/4129723

29-09-2019
|

سؤال

أحتاج إلى تطوير نص باستخدام رؤية الكمبيوتر من شأنه أن يلي:

مسح جميع إطارات فيديو Flash/HTML5 لوجوه الناس
حدد إطارات الفيديو التي تظهر الوجوه التي تنظر مباشرة إلى الكاميرا
اقتصاص الوجه في مربع مثالي
انسخ الوجه المزروع إلى ملف .png

أي توصيات لمكتبة Python Computer Vision التي يمكن أن تساعدني في تطوير هذا البرنامج النصي؟

المحلول

كما قال جونسي OpenCV هو أفضل رهان لك على الوجه "خارج الصندوق".

لاستخدام Flash Video كإقامة ، ستحتاج إلى شيء يتيح لك قراءة ملفات .flv (Flash Video) التي يمكنك الاتصال بـ OpenCV. لم أجرب هذا بنفسي ، لكنني أعتقد أنه إذا قمت بتثبيت OpenCV مع دعم FFMPEG (إذا كنت على Linux) ، فيجب أن تكون قادرًا على قراءة أي فيديو مع OpenCV بما في ذلك .FLV (أو أي تنسيق فيديو HTML5).

لزراعة المحاصيل هذه يشرح ما تريد. لتوفير الصورة المزروعة كما PNG تحقق من توثيق imwrite.

نصائح أخرى

ربما يكون OpenCV هو الخيار الأفضل لحالة الاستخدام المحددة: http://opencv.willowgarage.com/wiki/

إنه يحتوي على بعض الدعم المدمج لخوارزميات التعرف على الوجه القياسية ، ومن السهل جدًا الاستيقاظ والتشغيل في بيثون. ومع ذلك ، على الرغم من أنها مكتبة عميقة إلى حد ما ، إلا أنني متأكد تمامًا من أنه سيتعين عليك العثور على شيء آخر للتقاط الصور أولاً من Flash وإطعامها إلى فائدتك. لست متأكدًا من اقتصاص أيضًا ، لكن لهذا النوع من الأشياء ، فأنا متأكد من أن مكتبة Python Imaging ستعمل إذا لم يفعل OpenCV ذلك.

أتمنى أن يساعدك هذا.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow