سؤال

أحاول أن ألف رأسي حول هذه المهمة وأتساءل عما إذا كانت هناك طريقة قياسية للقيام بذلك أو بعض المكتبات التي ستكون مفيدة.

يتم تتبع بعض الأحداث وتوقيتها في العديد من مصادر البيانات S1 ... SN. المعلومات المسجلة هي نوع الحدث والجدول الزمني. قد يكون هناك عدة أحداث من نفس النوع بالتتابع أو قد تكون متقطعة. يمكن أن يكون هناك أحداث "مفقودة" - أي عندما يفتقدها أحد المصادر ، والعكس بالعكس ، عندما يقدم المصدر "إيجابيًا كاذبًا". عادة ما يكون هناك فرق زمني بين ملاحظات الحدث نفسه في مصادر مختلفة. يحتوي هذا الفارق الزمني على مكون ثابت بسبب الموقع الفعلي للمصادر ولكن قد يكون له أيضًا مكون متفاوتًا تم تقديمه بواسطة زمن استجابة الشبكة وعوامل أخرى.

أحتاج إلى العثور على خوارزمية من شأنها أن تجد الفاصل الزمني الأقصى الأمثل الذي يجب استخدامه لتجميع الملاحظات في جميع المصادر في "حدث ملحوظ" واحد والسماح باكتشاف الأحداث المفقودة والإيجابيات الخاطئة.

أتساءل عما إذا كان الحل هو في مكان ما في مجال الإحصاء بدلاً من خوارزميات. فإن أي مدخلات يحظى بتقدير كبير.

هل كانت مفيدة؟

المحلول

يبدو أنك تقوم ببناء نظام حضور :-) في النظام ، أقوم حاليًا ببناء هذا النوع من ملاحظات التجميع ضروري أيضًا. في حالتي ، هناك موظفون لديهم تمريرة سيضعونها أمام قائد المارة لتسجيل حضورهم. أولاً ، سيختار النظام جميع الحضور من موظف واحد. ثم سوف يضعهم في صناديق يوم واحد ، أمرت في وقت التسجيل. سيتم تقييم كل تسجيل حول ما إذا كانت بداية أم توقف. إذا كان التسجيل الأول هو تسجيل بداية ، فسيبحث النظام عن تسجيل توقف يصل إلى 12 ساعة كحد أقصى. إذا لم يتم إدخال التوقف. يمكن وضع ذكاء إضافي في مكانه عندما يكون التخطيط معروفًا. Perhapse يمكنك استخدام الإحصائيات ، ولكن في حالتي كانت مسألة الخوارزميات ، جنبًا إلى جنب مع معرفة المنظمة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top