ما هي مكتبة رؤية الكمبيوتر الجيدة للبيثون التي ستسمح لي لي بالعثور على وجوه في فيديو فلاش/HTML5؟

StackOverflow https://stackoverflow.com/questions/4129723

سؤال

أحتاج إلى تطوير نص باستخدام رؤية الكمبيوتر من شأنه أن يلي:

  1. مسح جميع إطارات فيديو Flash/HTML5 لوجوه الناس
  2. حدد إطارات الفيديو التي تظهر الوجوه التي تنظر مباشرة إلى الكاميرا
  3. اقتصاص الوجه في مربع مثالي
  4. انسخ الوجه المزروع إلى ملف .png

أي توصيات لمكتبة Python Computer Vision التي يمكن أن تساعدني في تطوير هذا البرنامج النصي؟

هل كانت مفيدة؟

المحلول

كما قال جونسي OpenCV هو أفضل رهان لك على الوجه "خارج الصندوق".

لاستخدام Flash Video كإقامة ، ستحتاج إلى شيء يتيح لك قراءة ملفات .flv (Flash Video) التي يمكنك الاتصال بـ OpenCV. لم أجرب هذا بنفسي ، لكنني أعتقد أنه إذا قمت بتثبيت OpenCV مع دعم FFMPEG (إذا كنت على Linux) ، فيجب أن تكون قادرًا على قراءة أي فيديو مع OpenCV بما في ذلك .FLV (أو أي تنسيق فيديو HTML5).

لزراعة المحاصيل هذه يشرح ما تريد. لتوفير الصورة المزروعة كما PNG تحقق من توثيق imwrite.

نصائح أخرى

ربما يكون OpenCV هو الخيار الأفضل لحالة الاستخدام المحددة: http://opencv.willowgarage.com/wiki/

إنه يحتوي على بعض الدعم المدمج لخوارزميات التعرف على الوجه القياسية ، ومن السهل جدًا الاستيقاظ والتشغيل في بيثون. ومع ذلك ، على الرغم من أنها مكتبة عميقة إلى حد ما ، إلا أنني متأكد تمامًا من أنه سيتعين عليك العثور على شيء آخر للتقاط الصور أولاً من Flash وإطعامها إلى فائدتك. لست متأكدًا من اقتصاص أيضًا ، لكن لهذا النوع من الأشياء ، فأنا متأكد من أن مكتبة Python Imaging ستعمل إذا لم يفعل OpenCV ذلك.

أتمنى أن يساعدك هذا.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top