مشكلة الاحتمالية - التكرارات عند الاختيار من سلة كبيرة

StackOverflow https://stackoverflow.com/questions/136456

  •  02-07-2019
  •  | 
  •  

سؤال

أحتاج أن أشرح للعميل سبب ظهور المخادعين بين اختبارين يفترض أنهما مختلفان.لقد مرت 20 عامًا منذ Prob and Stats.

لدي اختبار متعدد الاختيارات.هناك 192 سؤالًا في قاعدة البيانات ، يتم اختيار 100 بشكل عشوائي (بدون غملة).

من الواضح أن هناك احتمالًا بنسبة 100% لوجود 8 حالات خداع على الأقل بين أي اختبارين تم إنشاؤهما على هذا النحو.(مبدأ الحمامة)

كيف يمكنني حساب احتمال وجود 25 خداع؟50 مغفل؟75 مغفل؟

-تحرير بعد الحقيقة-قمت بتشغيل هذا من خلال Excel ، وأخذ مبالغ من الاحتمالات من N-100 ، لهذه المشكلة بالذات ، كانت الاحتمالات

n   P(n+ dupes)
40  97.5%
52  ~50% 
61  ~0
هل كانت مفيدة؟

المحلول

إرم، هذا حقا ضبابي حقا بالنسبة لي.لكن هناك (192 اختيار 100) امتحان محتمل، أليس كذلك؟

وهناك (100 اختر N) طرق لاختيار N المغفلين، ولكل منها (92 اختر 100-N) طرق لاختيار بقية الأسئلة، أليس كذلك؟

إذن أليس احتمال اختيار المغفلين N فقط:

(100 اختر ن) * (92 اختر 100-ن) / (192 اختر 100)

يحرر:لذلك إذا كنت تريد فرص ن أو أكثر الخدع بدلاً من N بالضبط، عليك جمع النصف العلوي من هذا الكسر لجميع قيم N من الحد الأدنى لعدد الخدع حتى 100.

إررر، ربما...

نصائح أخرى

بمجرد إنشاء الاختبار الأول، سيكون هناك 92 سؤالًا لم يتم استخدامها مطلقًا، و100 سؤال لم يتم استخدامها.إذا قمت الآن بإنشاء اختبار آخر يتضمن 100 سؤال، فإنك تختار من بين مجموعة مكونة من 92 سؤالًا لم يتم استخدامها من قبل، و100 سؤال تم استخدامها.من الواضح أنك ستحصل على عدد لا بأس به من التكرارات.

كنت تتوقع الحصول على (100/192) * 100 نسخة، أي.في أي اختبارين يتم اختيارهما عشوائيًا، سيكون هناك (في المتوسط) 52 سؤالًا مكررًا.

إذا كنت تريد احتمال وجود 25، أو 75، أو أيًا كان، فلديك خياران.

أ) العمل على الرياضيات

ب) محاكاة بعض عمليات التشغيل على جهاز الكمبيوتر

ربما يكون أعلى مما تعتقد.لن أحاول تكرار هذا المقال: http://en.wikipedia.org/wiki/Birthday_paradox

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top