إيجاد مكررة ملفات الفيديو من خلال قاعدة البيانات (الملايين), بصمات الأصابع ؟ نمط الاعتراف ؟

StackOverflow https://stackoverflow.com/questions/3591731

سؤال

في السيناريو التالي:

لدي مشروع وجود كتالوج حاليا نحو عشرة آلاف ملفات الفيديو ، وعدد سوف تزيد بشكل كبير.

ولكن الكثير منهم التكرارات.مع كل ملف فيديو علي المرتبطة دلالية وصفية المعلومات التي أريد أن دمج التكرارات لتحقيق أفضل النتائج لكل واحد.

الآن انا بحاجة الى بعض النوع من الإجراء حيث مؤشر البيانات الوصفية في قاعدة البيانات, و كلما فيديو جديد يدخل كتالوج نفس البيانات يتم احتساب وتقارن في قاعدة البيانات.

المشكلة الفيديو ليست نسخا طبق الأصل.يمكن أن يكون نوعية مختلفة ، أمبي اقتصاص, علامة مائية أو تتمة/مقدمة.أو قطع في بداية و/أو نهاية.

للأسف أفضل المقارنة أكثر وحدة المعالجة المركزية والذاكرة يحصل خطة عمل تنفيذ عدة طبقات من المقارنة التي تبدأ مع رشيقة جدا ولكن سريع المقارنة (maby الفيديو lengh مع تسامح 10%) ونهاية النهائي المقارنة التي تقرر ما إذا كان حقا مكررة (سيكون هذا المجتمع التصويت).

وذلك لدي المجتمع للتحقق من النتائج ويكفي أن يسلم "تخمينات جيدة" مع انخفاض نسبة ملكة جمال.

حتى الآن سؤالي هو ما هي الطبقات التي يمكن يا رفاق التفكير أو هل لديك أفضل النهج ؟

أنا لا أهتم الجهود الرامية إلى إنشاء البيانات الوصفية, لدي ما يكفي من العبيد للقيام بذلك.مجرد المقارنة يجب أن تكون سريعة.حتى إذا كان ذلك يساعد يمكنني تحويل الفيديو 100 مرة وكذلك...

هنا هي بلدي الحالي الأفكار:

  • طول الفيديو (ثانية)

  • الأول والأخير إطار الصورة التحليل

وأود أن إعادة تشكيل الصورة إلى حجم الصورة المصغرة للحصول على متوسط قيم rgb ثم تسلسل بكسل بكسل إذا كان لون في البكسل أكبر/أصغر من متوسط ممثلة 0 أو 1.لذلك أنا الحصول على ثنائي السلسلة التي يمكنني تخزينها في الخلية و لا منطقية بت مبلغ (بدعم من الخلية داخليا) و عد المتبقية uneval بت (وكذلك دعم داخليا ، ثم يكون Levenshtein المسافة من bianry سلاسل)

  • التطوير من البت مع مرور الوقت مع نفس vbr الترميز

أود أن تحويل الفيديو إلى vbr videofile مع نفس الإعدادات.ثم أود أن ننظر في البت في نقاط معينة من الوقت (نسبة مئوية من الفيديو الانتهاء أو مطلقة ثانية..ثم نود أن نحلل فقط جزء من الفيديو).نفس الشيء مع الصورة.Iif معدل البت أكبر متوسط 1 آخر به 0.ونحن جعل ثنائي السلسلة وتخزينها في قاعدة البيانات وحساب Levenshtein المسافة في وقت لاحق

  • الصوت analyisis (معدل البت و ديسيبل varaition مع مرور الوقت فقط مثل معدل البت الفيديو)

  • keyframe تحليل

صورة comarision مثل أول و آخر الإطار ولكن في keyframe المواقف ؟ سوف نستخدم نفس المصدر الملفات المستخدمة في البت calcluiations لأن مفتاحية ثقيلة يعتمد على ترميز و الإعدادات.

  • التطوير من اللون مع مرور الوقت

ربما دعونا نلقي واحد أو أكثر من مجالات/بكسل داخل الصورة و نرى كيف تتطور مع مرور الوقت.وكذلك تغيير الركبة/أقل من المتوسط.أسود/أبيض تكفي أعتقد.

  • تقديم اقتراحات للمستخدم للحصول على الموافقة النهائية...

أو أنا ذاهب تماما بطريقة خاطئة ؟ أعتقد أنني لا يمكن أن أكون أول من وجود هذه المشكلة ولكن لم يكن لدي أي حظ في إيجاد الحلول.

هل كانت مفيدة؟

المحلول

هذه مشكلة ضخمة ، حتى لقد اخترت أن أكتب طويلة نوعا ما رد على محاولة تتحلل المشكلة إلى أجزاء قد تكون أسهل حل.

من المهم أن المقارنات أن يؤديها باستخدام حساب الوقت و الموارد المتاحة:أشك في حل أن يأخذ أشهر سوف تكون مفيدة جدا في الفيديو دينامية قاعدة البيانات الخاصة بنا.و حجم قاعدة البيانات يجعل من المحتمل استخدام موارد الحوسبة السحابية غير مجدية.لذلك نحن حقا نهتم المحلية تكلفة كل المقارنة في عدة مجالات مختلفة:1) تخزين البيانات, 2) حساب الموارد ، 3) الوقت.

مفتاح واحد تكلفة للنظر هو أن استخراج البيانات المطلوبة من كل فيديو لأي مقاييس المقارنة تستخدم.بمجرد استخراج البيانات المتاحة ، ثم تكلفة إجراء المقارنة يجب النظر فيها.وأخيرا ، فإن المقارنات اللازمة لتتناسب مع جميع مقاطع الفيديو مع بعضها البعض يجب أن يؤديها.

تكلفة أول خطوتين O(1) على عدد من أشرطة الفيديو.تكلفة الخطوة الأخيرة يجب أن تكون أسوأ من س(1) يحتمل أن تكون أسوأ من ذلك بكثير.لذلك هدفنا الأساسي ينبغي التقليل من التكاليف من الخطوة الأخيرة ، حتى لو كان ذلك يعني إضافة العديد من المبكر, خطوات بسيطة.

الأمثل خوارزميات هذه العملية سوف تعتمد إلى حد كبير على خصائص قاعدة البيانات ، ومستوى واحد و متعددة يطابق الوجود.إذا 100 ٪ من أشرطة الفيديو تطابق بعض الفيديو الأخرى, ثم سوف تحتاج إلى تقليل تكلفة مباراة ناجحة.ومع ذلك ، من المرجح الحالة هو أن المباريات سوف تكون نادرة, لذلك سوف تحتاج إلى تقليل تكلفة ناجحة في المباراة.وهذا هو القول ، إذا كان هناك وسيلة سريعة وقذرة أن أقول "الفيديو لا يمكن أن تكون مباريات', ثم يجب أن تستخدم أولا قبل أن نبدأ حتى التأكد من المباراة.

توصيف قاعدة البيانات أولا بعض العينات من ناحية مطابقة estimnate درجة مطابقة داخل قاعدة البيانات.هذه التجربة يجب أن تظهر كيف زائدة الفيديو "تجمعت":إذا كان الفيديو من المباراة ، كيف المرجح هو أن يكون أكثر من واحد في المباراة ؟ ما هي النسبة المئوية من جميع المباريات كانت أيضا جزءا من عدة المباراة ؟ هذه العملية سوف تسفر عن 'النموذج' من قاعدة البيانات (على التوزيع الإحصائي) التي سيتم استخدامها للمساعدة في اختيار خوارزمية وضبط النظام.

تسير إلى الأمام وسوف نفترض مباريات نادرة نسبيا.بعد كل شيء, إذا كان هناك الكثير من المباريات ، الفيديو "أجمة" ، مما جعل قاعدة البيانات أصغر ، مما يجعل المشكلة أكثر بساطة.دعونا نفترض المشكلة يبقى بأقصى قدر ممكن.

كنت داعية متعدد المستويات التصنيف النهج ، حيث كنا نبني سلسلة من الخوارزميات التي مرارا وتكرارا أداء ثنائي قرار "الفيديو لا تتطابق" / "الفيديو قد ربما المباراة".فقط آخر الخوارزمية في سلسلة يحتاج إلى إخراج الجواب "الفيديو المباراة."

التصنيف/خوارزميات مطابقة يمكن أن تفشل في أي أو كل من طريقتين:إيجابية كاذبة (غير مطابقة أشرطة الفيديو mislabled كما مطابقة) و سلبية كاذبة (مطابقة أشرطة الفيديو تسميتها غير مطابقة).كل هذه القرارات الخاطئة لديها مجموعة من الاحتمالات المرتبطة به ، و نريد أن نقلل على حد سواء.

وبما أننا في بناء خوارزمية أنابيب نريد الخوارزميات التي هي جيدة جدا في تحديد غير مباريات دون خطأ ، وهذا يعني أنها يجب أن يكون منخفض للغاية كاذبة معدل رفض و نحن لا أهتم كثيرا حول كاذبة تقبل معدل.على سبيل المثال, غريب آل استنساخ الفيديو قد يبدو كثيرا مثل الأصلي ، ونحن قد لا تكون قادرة على أن تظهر أنها ليست المباراة الأصلي حتى وقت لاحق في خوارزمية خط أنابيب.

أبسط, الأسرع, الأكثر موثوقية الخوارزميات يجب أن يتم تشغيل أول, منذ بأغلبية ساحقة الغالبية العظمى من الاختبارات سوف تسفر عن "عدم تطابق" نتيجة.أبسط تحقق سيكون للبحث عن الملفات متطابقة في قاعدة البيانات ، شيئا به العديد سريعة وبسيطة الملفات و قاعدة البيانات وصيانة المرافق العامة.بعد هذا المسح هو تشغيل, يمكننا أن نفترض أننا فعلا بحاجة إلى فتح وقراءة ملفات الفيديو للكشف عن الاختلافات.

ومنذ فيديو المقارنة صعبة نسبيا, دعونا نبدأ مع الصوت.أعتقد من قاعدة بيانات الأولى كونه جمع MP3 التي قد تحتوي على التكرارات.بعد كل شيء, إذا حصلنا على الصوت جيدة المباراة ، فمن المحتمل جدا أن يكون لدينا فيديو مباراة ، والعكس بالعكس.يمكن القول إن الصوت هو "عادل" ممثل الفيديو.لحسن الحظ, سريع البحث على شبكة الإنترنت سوف تسفر عن العديد من البصمات الصوتية و المقارنة الحزم التي هي موثوق بها وسريعة ناضجة.الصوت بصمة سوف تحتاج إلى أن تكون الناتجة عن كل الفيديو في قاعدة البيانات.أشرطة الفيديو تفتقر إلى مسار الصوت تلقائيا الوقوع في "يمكن أن تتطابق مع" مجموعة.

ولكن هناك 'مسكتك هنا:ماذا عن صوت المبالغ?إذا كان الفيديو هو ترميز مرتين ، مع أو بدون صوت ، هل هي مطابقة أم لا ؟ ماذا عن الصوت الفرنسي vs الإسبانية أو الإنجليزية ؟ إذا كانت هذه ينبغي أن ينظر إلى أن مباراة ، ثم اختبار الصوت قد تحتاج إلى تخطي.

عند هذه النقطة, نحن نعرف نظام الملفات وإدخالات كلها "مختلفة بما فيه الكفاية" ، ونحن نعرف المسارات الصوتية كلها "مختلفة بما فيه الكفاية" (إذا جاءت) ، وهو ما يعني أننا لا يمكن تأجيل النظر في بيانات الفيديو لفترة أطول.لحسن الحظ, هذا ينبغي أن تحتاج إلى القيام به فقط جزء صغير من قاعدة بيانات الفيديو ، لذلك نحن يمكن أن تحمل بعض التكاليف.كما كان من قبل, ونحن سوف لا تزال تريد أن أول محاولة القضاء بسرعة غير مباريات قبل أن نحاول بشكل إيجابي التسمية مباراة.

منذ نحن بحاجة إلى اتخاذ القرار التغييرات بعين الاعتبار (على سبيل المثال ، من 1080p إلى أجهزة أي بود) ، نحن بحاجة إلى وسيلة لوصف معلومات الفيديو ليس فقط من قرار مستقل ، ولكن أيضا تسامحا من الضوضاء المضافة و/أو البيانات المفقودة كجزء من تغيير القرار.يجب أن تتسامح مع معدل الإطار التغييرات (من فيلم 24 إطارا في الثانية الفيديو 30 إطارا في الثانية).وهناك أيضا نسبة الارتفاع التغييرات النظر في مثل هذه الفترة من 4:3 NTSC إلى 16:9 HD.نريد أن التعامل مع اللون الفضاء التغييرات ، مثل من اللون أحادية اللون.

ثم هناك التحولات التي تؤثر على كل هؤلاء في وقت واحد ، مثل الشفرة بين HD و PAL, والتي يمكن في نفس الوقت تؤثر على لون الفضاء, معدل الإطار, ونسبة العرض إلى الارتفاع القرار.توصيف ينبغي أيضا أن تكون متسامحة مع بعض درجة من المحاصيل و/أو التعبئة ، مثل أن يحدث من التبديل ذهابا وإيابا بين 4:3 و 16:9 نسب (letterboxing ، ولكن ليس pan & scan).كما يجب التعامل مع مقاطع الفيديو التي تم اقتطاعها ، مثل إزالة من اعتمادات نهاية ميزة الفيلم.ومن الواضح أنه يجب علينا أيضا التعامل مع الاختلافات التي أنشأتها مختلف الترميز التي تم تغذيتها متطابقة دفق الفيديو.

قائمه!دعونا النظر في بعض الأمور ونحن قد تختار عدم حساب:وأظن أنه لا بأس أن تفشل في العثور على تطابق عندما تشويه الصورة الحالية ، على الرغم من حقيقة أن مشوهة تزييفها ليس من غير المألوف ، وخاصة في 35mm شاشة عريضة أفلام مباشرة الممسوحة ضوئيا دون مشوهة التعمير (طويل القامة-نحيف الناس).ونحن قد تختار أيضا أن تفشل عندما الكبيرة علامات مائية موجودة في منتصف الإطار ، على الرغم من أننا سوف تريد أن تتسامح مع أصغر المائية في الزوايا.وأخيرا ، فلا بأس أن تفشل في مباراة مقاطع الفيديو التي تم زمنيا مشوهة أو مكانيا انقلبت ، مثل عندما واحد هو slo-mo أخرى ، أو قد انقلبت من اليسار إلى اليمين.

هل هذا فقط عن تغطية الفيديو الفضاء ؟ نأمل من الواضح لماذا من المهم أن تبدأ مع نظام الصوت!وهذا هو أولا التفكير في قاعدة البيانات الخاصة بك مثل MP3 جمع قبل النظر في مجموعة الفيديو.

تجاهل الصوت ، الفيديو هو مجرد أمر تسلسل من الصور الثابتة.لذلك نحن في الواقع نبحث عن صورة واحدة أو أكثر مقارنة الخوارزميات جنبا إلى جنب مع واحد أو أكثر من السلاسل الزمنية مقارنة الخوارزميات.هذا يمكن أن يكون إما أزواج منفصلة الخوارزميات (تميز كل إطار ، ثم تميز سلسلة من إطارات) ، أو يمكن دمجها في واحد خوارزمية (نظرة على الاختلافات بين الإطارات).

الصور نفسها قد تكون متحللة كذلك إلى أحادية اللون "الهيكلي" صورة ولون 'تراكب'.وأعتقد أننا يمكن تجاهل اللون المعلومات ، إذا كان حسابيا مريحة للقيام بذلك.

من سبق ، فإنه قد يبدو وكأنه لقد افترضت علينا تماما فك شفرة الفيديو من أجل إجراء أي مقارنات على ذلك.هذا ليس بالضرورة ، على الرغم من أن المقارنة بين البيانات المشفرة لديه العديد من الصعوبات التي تحد من فائدته.واحدة كبيرة استثناء إلى هذا الكائن على مستوى ترميزات الفيديو مثل MP4 ، حيث عالي المستوى متعددة إطار المقارنات تم تنفيذها.للأسف, موضوع مقارنات بين MP4 تيارات لم ير الكثير من البحث ، وأنا على علم من لا حزم قادرة على أداء هذه الوظيفة.ولكن إذا كان يمكنك العثور على واحد ، واستخدامها!

معظم الفيديو الرقمية تيارات استخدام أنظمة تشفير مثل MPEG2, Quicktime, أو شيئا من هذا القبيل.هذه المخططات كل استخدام مفهوم الأطر الرئيسية و الفرق إطارات ، على الرغم من كل تنفذ بشكل مختلف.عندما أشرطة الفيديو المختلفة يجري مقارنة (تلك التي ليست نفس الحجم) ، فمن غير المرجح الأطر الرئيسية و الفرق إطارات سوف تتطابق مع أي من المفيد درجة.ولكن هذا لا يعني أنه من المستحيل, و وجود حزم أن محاولة لاستخراج المعلومات المفيدة من هذه التيارات دون تنفيذ كامل فك التشفير.إذا كان يمكنك العثور على واحد التي هي سريعة ، قد تقع في "لماذا لا نحاول" فئة من الاختبارات.

الحيلة الوحيدة التي سوف تستخدم بدلا من فك إطارات تماما ، وأود أن بدلا فك منهم فقط إلى مكون منفصل قنوات (HSV, الأعرج, YUV, أيا كان) وليس كل الطريق إلى RGB framebuffer (ما لم يكن هذا ما كان المشفرة, بالطبع).من هنا أود القادم إنشاء فصل الإنارة و التلون (اللون) إطارات لذلك المقارنات يمكن القيام بها في المجالات ذات الصلة.فك كل وسيلة RGB framebuffer قد يعرض الأخطاء التي قد تجعل العثور على المباريات أكثر صعوبة.

أتمنى أنك تجاهل معلومات اللون.منذ أحادية اللون الفيديو يجب أن يطابق لونه الأصلي ، ونحن ببساطة لا يهمني اللون!

كيف تسلسل الناتج من أحادية اللون إطارات أفضل بالمقارنة مع سلسلة أخرى قد تبدو مختلفة جدا, ولكن لا يزال قد تكون مباراة ؟ كانت هناك حرفيا عقود من البحوث في هذا المجال ، تصنيفها ضمن "نطاق ثابتة مباراة الكشف".للأسف القليل جدا من هذا البحث تم تطبيقها مباشرة إلى تحديد أشرطة الفيديو عندما تفعل أو لا تتطابق.

لأغراضنا ، يمكننا مقاربة هذه المسألة من عدة اتجاهات.أولا يجب علينا أن نعرف عن أنفسنا ما هو وليس مباراة في أحادية اللون المجال.على سبيل المثال, نحن لا نهتم مستوى بكسل الخلافات ، لأن حتى لو اثنين من مطابقة-ولكن-فيديوهات مختلفة كان نفس القرار ، يجب أن نتسامح مع بعض مستوى من الضوضاء بسبب أشياء مثل التشفير الخلافات.

بسيطة (ولكن بطيئة) الطريق إلى الأمام هو تحويل كل صورة إلى شكل مستقل عن القرار ونسبة الارتفاع.واحد مثل هذا التحول هو في تردد المكاني المجال و 2D الاتحاد الفرنسي للتنس مثالية لهذا.بعد رميه وهمي مكون الحقيقي عنصر قد يتم اقتطاعها في الترددات العالية لإزالة الضوضاء في الترددات المنخفضة إلى إزالة نسبة الارتفاع الآثار ، ثم تطبيع مستوى نطاق القضاء على القرار الخلافات.البيانات الناتجة يبدو غريبا صغيرة الصورة التي قد تكون مقارنة مباشرة عبر دفق الفيديو.

هناك الكثير من الممكن التحول إطار استراتيجيات كثيرة إلى حد كبير أكثر كفاءة من الاتحاد الفرنسي للتنس ، بحث الأدب ينبغي تسليط الضوء عليها.للأسف, أنا أعرف عدد قليل من التي تم تنفيذها في مكتبات البرامج التي هي سهلة الاستخدام الاتحاد الفرنسي للتنس.

مرة واحدة لقد تحولت أحادية اللون إطارات في أصغر وأكثر فائدة المجال لا يزال علينا إجراء مقارنة أخرى مثل تيار من فيديو آخر.و هذا الفيديو هو من شبه المؤكد أن لا يكون الإطار إلى الإطار المباراة ، حتى مقارنة بسيطة بالتأكيد سوف تفشل.نحن بحاجة إلى المقارنة التي سوف تتخذ على حساب الفروق في المجال الزمني ، بما في ذلك إضافة/إزالة إطارات الاختلافات في معدل الإطار.

إذا كنت ننظر إلى سلسلة من الاتحاد الفرنسي للتنس إطارات, سوف تلاحظ بعض سلوك واضح للغاية.المشهد يتلاشى مفاجئة للغاية من السهل على الفور ، يقطع كما يمكن تمييز ، وهناك عادة فقط التغييرات البطيئة ينظر في الاتحاد الفرنسي للتنس بين التخفيضات.من تسلسل FFTs يمكننا تسمية كل إطار كونه أول بعد قطع/تتلاشى ، أو الإطار بين الجروح/يتلاشى.ما هو مهم هو الوقت بين كل قطع/تتلاشى مستقلة من عدد إطارات بينهما ، مما يخلق توقيع أو بصمة والتي هي مستقلة إلى حد كبير من معدل الإطار.

أخذ هذه البصمات من الفيديو بأكمله ينتج البيانات التي يتم على نطاق واسع أصغر من الفيديو نفسه.بل هو أيضا تسلسل خطي من الأرقام البسيطة الوقت-سلسلة ناقلات, مثل الصوت و يمكن تحليلها باستخدام العديد من الأدوات نفسها.

الأداة الأولى هي إجراء الارتباط ، لتحديد ما إذا كان نمط من التخفيضات في فيديو واحد هو وثيقة المباراة في آخر الفيديو.إذا كان هناك اختلافات كبيرة ، ثم الفيديو المختلفة.إذا كانت مباراة متكافئة ، ثم سوى بضع FFTs بعد كل ترتبط قطع بحاجة مقارنة لتحديد ما إذا كانت الإطارات مماثلة يكفي أن تكون مباراة.

لن أخوض في المقارنة بين 2D FFTs هنا ، لأن هناك وفرة المراجع أن القيام بهذه المهمة على نحو أفضل بكثير مما كنت يمكن.

ملاحظة:هناك العديد من التلاعبات الأخرى (خارج 2D FFT) التي يمكن تطبيقها على أحادية اللون الإطارات للحصول على بصمات الأصابع الإضافية.تمثيل الصورة الفعلية قد يكون المحتوى التي تم إنشاؤها عن طريق استخراج الداخلية حواف الصورة (حرفيا مثل FBI بصمات الأصابع) ، أو بشكل انتقائي thresholding صورة و أداء 'blobbing' عملية (إنشاء قائمة مرتبطة من ذات المنطقة واصفات).تتبع تطور حواف و/أو النقط بين الإطارات يمكن استخدامها ليس فقط لتوليد قطع قوائم ، ولكن يمكن أيضا أن تستخدم في استخراج إضافية عالية المستوى صورة الخصائص التي من شأنها أن تضيع باستخدام 2D الاتحاد الفرنسي للتنس.

قمنا ببناء سلسلة من مقارنة الخوارزميات التي يجب أن تكون سريع جدا في البحث غير المباريات, و لا تتطلب الكثير من الوقت بشكل قاطع تحديد المباريات.للأسف, بعد أن الخوارزميات لا حل جعل!يجب علينا النظر في العديد من القضايا المتعلقة بكيفية هذه الخوارزميات يجب أن يكون أفضل تنفيذ.

أولا نحن لا نريد فتح و قراءة كل ملف فيديو بأي مرات أكثر من اللازم, آخر وحدة المعالجة المركزية يمكن أن المماطلة في انتظار البيانات من القرص.نحن أيضا لا تريد أن تقرأ أي زيادة في ملف أكثر من اللازم, على الرغم من أننا لا تريد أن تتوقف عن القراءة في وقت قريب جدا وربما يغيب في وقت لاحق من المباراة.أن المعلومات التي تميز كل فيديو يتم حفظها ، أو ينبغي recomputed عند الحاجة ؟ معالجة هذه القضايا سوف تسمح بكفاءة وفعالية الفيديو مقارنة بين نظام تطويرها واختبارها ونشرها.

لقد أظهرنا أنه من الممكن لمقارنة ملفات الفيديو مع بعض الأمل في العثور على المباريات تحت متغير بدرجة كبيرة ، الكفاءة الحاسوبية.

بقية وقد تركت باعتبارها ممارسة للقارئ.;^)

نصائح أخرى

السؤال الكبير!فقط اختبار معرفة أي من تلك العوامل سوف يكون أفضل المؤشرات.بعض الأفكار:

  • تطور معدل البت أكثر من مرة مع نفس vbr الترميز:يبدو وحدة المعالجة المركزية الكثيفة جدا ولكن أعتقد أن ذلك من شأنه أن يعطي نتائج رائعة.تحليل الصوت يبدو أنها قد تعطي نتائج مماثلة مع عمل أقل.
  • الأول والأخير إطار الصورة التحليل:لن 50% من هذه الأسود ؟ قد تكون فكرة أفضل لاستخدام جدا الأوسط الإطار, ولكن أنا لا أعتمد على هذه التقنية كونها موثوقة.
  • استخدام إحصائيات بايزي لتسجيل العوامل التي تجعل أفضل مساهمات إيجابية في المباراة.هذا يمكن القيام به في مرحلة الاختبار للتخلص من غير مفيدة ومكلفة المقارنات.
  • الحصول على المستخدمين للمساعدة! السماح للمستخدمين مجموعة معا التكرارات وجدوا.التصويت على واحد مع أفضل نوعية و هذا سيكون بمثابة الرئيسية/النسخة الرسمية داخل الفريق.
  • نبدأ مع أسهل مقارنات وإضافة المزيد من الاختبارات المتطورة عندما تجد عيوب بسيطة منها.طول الفيديو سيكون فكرة جيدة أن تبدأ مع ، ثم ربما بعض بدائية تحليل الصوت ، والعمل طريقك من هناك.

مجرد محاولة هذا المنتج مكررة البحث عن الفيديو (ex.البحث البصري المهر) ، والتي يمكن أن تجد تكرار ملفات الفيديو من مختلف بت صيغ القرارات وغيرها.

على سبيل المثال, نجوم الحروب.avi (640 × 480 H. 264) sw.ميلا في الغالون (1280x720 MPEG) سيتم الكشف عن التكرارات ، في حالة كل منهم نسخة من فيلم عظيم - حرب النجوم.

حسب موقع المنتج يستخدم بعض الفيديو البصمات من التقنيات ، مثل مفتاح إطارات exctraction أو شىء.مثل هذا هل تكون مستقلة عن ترميز الفيديو, قرار, جودة, معدل البت وغيرها.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top