Problème de probabilité - Doublons lors du choix dans un grand panier
-
02-07-2019 - |
Question
Je dois expliquer au client pourquoi les dupes se présentent entre 2 examens supposés différents. Cela fait 20 ans que Prob et Stats se sont écoulés.
J'ai un examen à choix multiples généré. Il y a 192 questions dans la base de données, 100 sont choisis au hasard (pas de dupes).
Évidemment, il y a 100% de chances qu'il y ait au moins 8 dupes entre deux examens ainsi générés. (Principe du casier)
Comment puis-je calculer la probabilité qu'il y ait 25 dupes? 50 dupes? 75 dupes?
- Modifier après coup - J'ai couru cela par Excel, en prenant les sommes des probabilités de n-100, Pour ce problème particulier, les probabilités étaient
n P(n+ dupes)
40 97.5%
52 ~50%
61 ~0
La solution
Et il existe (100 choix N) des méthodes de sélection de N dupes, chacune avec (92 choix de 100 N) des méthodes de sélection du reste des questions, non?
La probabilité de choisir N ??dupes n’est-elle pas simplement:
(100 choisissez N) * (92 choisissez 100-N) / (192 choisissez 100)
EDIT: Donc, si vous voulez les chances de N ou plus dupes au lieu d’exactement N, vous devez additionner la moitié supérieure de cette fraction pour toutes les valeurs de N à partir du nombre minimum de dupes à 100.
Euh, peut-être ...
Autres conseils
Une fois que vous avez créé le premier examen, il y a 92 questions qui n'ont jamais été utilisées et 100 qui l'ont été. Si vous créez maintenant un autre examen contenant 100 questions, vous choisissez parmi 92 questions qui n'ont jamais été utilisées et 100 qui l'ont déjà été. Clairement, vous allez avoir pas mal de doublons.
Vous vous attendez à obtenir (100/192) * 100 doublons, c'est-à-dire que pour deux examens choisis au hasard, il y aura (en moyenne) 52 questions en double.
Si vous voulez avoir une probabilité de 25, de 75 ou autre, vous avez le choix.
a) Faites le calcul
b) Simulez quelques essais sur un ordinateur
C'est probablement plus élevé que vous ne le pensez. Je n'essaierai pas de reproduire cet article: http://fr.wikipedia.org/wiki/Birthday_paradox