problema probabilidade - Duplicatas na escolha da cesta grande
-
02-07-2019 - |
Pergunta
Eu preciso explicar para o cliente por que tolos estão aparecendo entre 2 exames supostamente diferentes. Tem sido 20 anos desde Prob e Estatísticas.
Eu tenho um exame de múltipla escolha gerado. Há 192 perguntas no banco de dados, 100 são escolhidos aleatoriamente (sem dupes).
Obviamente, existe uma probabilidade de 100% de não ser, pelo menos, 8 tolos entre quaisquer dois exames assim gerado. (Princípio Pigeonhole)
Como faço para calcular a probabilidade de haver 25 crédulos? 50 crédulos? 75 crédulos?
- Edit após o fato - Corri isso através de excel, levando somas das probabilidades de n-100, Para este problema particular, as probabilidades eram
n P(n+ dupes)
40 97.5%
52 ~50%
61 ~0
Solução
Erm, isso realmente é realmente nebuloso para mim. Mas não são (192 escolha 100) possíveis exames, certo?
E há (100 escolher N) maneiras de escolher dupes N, cada um com (92 escolher 100-N) maneiras de pegar o resto das perguntas, não?
Portanto, não é a probabilidade de escolher N crédulos apenas:
(100 escolher N) * (92 escolher 100-N) / (192 escolher 100)
EDIT: Então, se você quer que as chances de N ou mais engana em vez de exatamente N, você tem que somar a metade superior do que a fração de todos os valores de N a partir do número mínimo de dupes até a 100.
Errrr, talvez ...
Outras dicas
Depois de criar o primeiro exame, há 92 perguntas que nunca foram utilizados, e 100 que têm. Se você agora gerar um outro exame, com 100 perguntas nela, você está escolhendo a partir de um conjunto de 92 perguntas que nunca foram utilizados, e 100 que têm. É claro que você está indo para obter algumas duplicatas.
Você esperaria para obter (100/192) * 100 duplicatas, ou seja, em quaisquer dois exames escolhidos aleatoriamente, haverá (em média) de 52 perguntas duplicadas.
Se você quiser a probabilidade de que há 25, ou 75, ou o que quer, então você tem duas escolhas.
a) trabalhar a matemática
b) simular algumas corridas em um computador
É provavelmente maior do que você pensa. Eu não vou tentar duplicar este artigo: http://en.wikipedia.org/wiki/Birthday_paradox