Pergunta

Este é um bom porque é tão contra-intuitivo:

Imagine que uma urna cheia de bolas, dois terços dos quais são de uma cor e um terço dos quais são de outro. Um indivíduo tem atraído 5 bolas da urna e descobriu que quatro são vermelhos e 1 é branco. Outro indivíduo tem atraído 20 bolas e descobriram que 12 são vermelhos e 8 são de cor branca. Qual dos dois indivíduos devem se sentir mais confiante de que a urna contém dois terços de bolas vermelhas e um terço bolas brancas, e não vice-versa? Que chances cada um deve dar individual?

Eu sei a resposta certa, mas talvez eu não começ completamente o cálculo probabilidades. Alguém pode explicar?

Foi útil?

Solução

Let A ser o evento que 2/3 das bolas são vermelhas, e depois ¬ A é o evento que 2/3 das bolas são brancos. Vamos B ser o caso em que o primeiro observador vê 4 bolas vermelhas de 5, e deixe C ser o evento que o segundo observador vê 12 bolas vermelhas em 20.

A aplicação de alguns combinatória simples, temos que

  • P ( B | A ) = (5 escolher 4) (2/3) 4 (1/3) 1 = 80/243
  • P ( B | ¬ A ) = (5 escolher 4) (1/3) 4 (2/3) 1 = 10/243

Portanto, a partir Lei de Bayes, observador 1 tem um nível de confiança de 80 / (80 + 10) = 8/9 que A é verdade.

Para o segundo observador:

  • P ( C | A ) = (20 escolher 12) (2/3) 12 (1/3) 8 = 125970 * 2 12 / 3 20
  • P ( C | ¬ A ) = (20 escolher 12) (1/3) 12 (2/3) 8 = 125970 * 2 8 / 3 20

Então, novamente a partir Lei de Bayes, observador 2 tem um nível de confiança de 2 12 / (2 12 + 2 8 ) = 16 / 17 que A é verdade.

Portanto, observador dois tem um maior nível de confiança que 2/3 das bolas são vermelhos. A chave é entender como Lei de Bayes funciona. Na verdade, tudo o que importa é a diferença no número de bolas vermelhas e brancas observado. Tudo o resto (especificamente o número total de bolas desenhada) anula nas equações.

Outras dicas

Eliezer Yudkowsky tem uma (muito, muito longo, mas bom) explicação de Bayes Teorema . Cerca de 70% para baixo, há um começo parágrafo "Na frente de você é uma mochila" que explica o cerne deste problema.

O punchline é que tudo o que importa é a diferença entre quantas vermelho e bolas brancas foram desenhados. Assim, contrário para o que os outros têm dito, você não tem que fazer qualquer cálculos. (Isto está a tornar uma das premissas razoáveis ??(a) que as bolas são desenhadas com a substituição , ou (b) a urna tem um muito de bolas. Então, o número de bolas não importa) Aqui está o argumento:.

Lembre-se de Bayes Teorema: P (A | B) = P (B | A) * P (A) / P (B). (Uma nota sobre terminologia: P (A) é o antes e P (A | B) é o posterior B é alguma observação que você fez, e a terminologia reflete sua. confiança antes e após sua observação.) Esta forma do teorema é bom, e @bobince e @ Adam Rosenfield aplicado corretamente. No entanto, usando este formulário diretamente faz você suscetível a erros aritméticos e ele realmente não transmitir a coração de Bayes teorema. Adam mencionado em seu posto (e eu mencionei acima) que tudo o que importa é a diferença entre o número de bolas vermelhas e brancas foram tiradas, porque "tudo o resto anula nas equações". Como podemos ver isso sem fazer quaisquer cálculos?

Podemos usar os conceitos de odds ratio e razão de probabilidade . O que é uma razão de chances? Bem, em vez de pensar sobre P (A) e P (¬), vamos pensar sobre o seu rácio P (A): P (¬). Ou é recuperável a partir do outro, mas as obras aritméticas fora mais agradável com odds ratio, porque não temos a normalizar. Além disso, é mais fácil de "pegar" o teorema de Bayes na sua forma alternativa.

O que quero dizer não temos a normalizar, e qual é a forma alternativa? Bem, vamos computação. Bayes' teorema diz que as probabilidades posteriores são

P (A | B): P (¬ A | B) = (P (B | A) * P (A) / P (B)): (P (B | ¬ A) * P (¬ ) / P (B)).

O P (B) é um factor de normalização para fazer a soma de probabilidades de um; No entanto, estamos trabalhando com relações, onde 2: 1 e 4: 2 chances são a mesma coisa, de modo que o P (B) cancela. Ficamos com uma expressão fácil que acontece de fator:

P (A | B): P (¬ A | B) = (P (B | A) * P (A)): (P (B | ¬ A) * P (¬ A)) = (P (B | A): P (B | ¬)) * (P (A): P (¬))

Já ouviu falar do segundo mandato lá; é a razão de probabilidade anterior. O que é P (B | A): P (B | ¬)? Isso é chamado o razão de probabilidade . Portanto, a nossa expressão final é

<> fortes probabilidades posteriores = razão de probabilidade * probabilidades anteriores.

Como podemos aplicá-lo nesta situação? Bem, suponha que nós temos algumas chances anteriores x: y para o conteúdo da urna, com x representando 2 / 3rds vermelho e y representam 2 / 3rds branco. Suponha que desenhar um única bola vermelha. A taxa de probabilidade é P (Drew bola vermelho | urna é 2 / 3RDS vermelho): P (Drew bola vermelho | urna é 2 / 3RDS branco) = (2/3): (1/3) = 2: 1. Assim, o posterior probabilidades são 2x: y; se tivéssemos tirado uma bola branca, as probabilidades posteriores seria x: 2y pelo raciocínio similar. Agora vamos fazer isso para cada bola em seqüência ; se a chama são independentes, então nós apenas multiplicam todas as odds ratio. Então nós temos que se começarmos com um odds ratio de x: y e desenhar bolas R Vermelho e w bolas brancas, temos um odds ratio final

(x: y) * (2: 1) ^ r * (1: 2) ^ w = (x * 2 ^ r): (Y * 2 ^ w) = (x: y) * (2 ^ (rw): 1.)

Assim, vemos que tudo o que importa é a diferença entre r e w. Ele também permite-nos facilmente resolver o problema. Para a primeira pergunta ( "quem deve ser mais confiante?"), As probabilidades anteriores não importa, contanto que0 ou 0:: eles não 1 é 1 e ambas as pessoas têm antecedentes idênticos. Com efeito, se as suas idênticos anterior era x: y, posterior da primeira pessoa seria (2 ^ 3 * x): y, enquanto posterior da segunda pessoa seria (2 ^ 4 * x): y, de modo que a segunda pessoa é mais certeza.

Suponhamos, além disso, que as probabilidades anteriores eram uniformes, que é de 1: 1. Em seguida, posterior da primeira pessoa seria 8: 1, enquanto que a segunda pessoa seria de 16: 1. Podemos facilmente traduzi-las em probabilidades de 8/9 e 16/17, confirmando os outros cálculos.

O ponto aqui é que se você get a equação em negrito acima, então este problema é realmente fácil . Mas como importante , você pode ter certeza que você não estragar qualquer aritmética, porque você tem que fazer tão pouco.

Portanto, esta é uma questão de programação ruim, mas é um bom teste da equação em negrito. Apenas para a prática, vamos aplicá-la a mais dois problemas:

I escolher aleatoriamente uma das duas moedas, uma moeda ou uma falsificação, moeda duas pontas, cada um com 50% de probabilidade. Eu lançá-lo três vezes e ele vem para cima cabeças tudo três vezes. Qual é a probabilidade é a moeda real?

As probabilidades anteriores são reais: falso = 1: 1, como indicado no problema. A probabilidade de que teria visto três cabeças com a moeda é verdadeira 1/8, mas é 1 com o falso moeda, de modo que a relação de probabilidade é de 1: 8. Assim, as probabilidades posteriores são = * antes probabilidade = 1: 8. Assim a probabilidade é a verdadeira moeda é 09/01.

Este problema também traz uma advertência importante: há um razão de verossimilhança possivelmente diferente para cada observação possível. Isto é porque a razão de probabilidade para B é P (B | A): P (B | ¬ A), que não está necessariamente relacionado com a taxa de probabilidade para ¬B, que é P (¬B | A): P (¬ B | ¬). Infelizmente, em todos os exemplos acima, eles foram inversos um do outro, mas aqui, eles não são.

De fato, suponha que eu jogar a moeda uma vez e obter caudas. Qual é a probabilidade é a moeda real? Obviamente um. Como é que Bayes Teorema de check-out? Bem, a razão de verossimilhança para esta observação é a probabilidade de ver este resultado com a moeda real frente ao falsa moeda, que é 1/2: 0 = 1: 0. Ou seja, vendo um única caudas mata a probabilidade de ser falso da moeda, que verifica para fora com nossa intuição.

Aqui está o problema mencionado na página de Eliezer:

Na frente de você é uma mochila contendo 1.000 fichas de poker. I começou com dois tais mochilas, um contendo 700 e 300 chips de vermelho azul, o outro contendo 300 vermelho e azul 700. Virei uma moeda para determinar qual mochila para usar, então sua probabilidade antes que a mochila na frente de você é a mochila vermelha é de 50%. Agora, você provar de forma aleatória, com substituição após cada chip. Em 12 amostras, você obter 8 vermelhos e 4 blues. Qual é a probabilidade de que este é o saco predominantemente vermelha? (Você não precisa ser exato -. Uma estimativa aproximada é bom o suficiente)

As probabilidades anteriores são vermelho: azul = 1: 1. As razões de probabilidade são 7: 3 e 3: 7, de modo que as probabilidades posteriores são (7: 3) ^ 8 * (3: 7) ^ 4 = 7 ^ 4: 3 ^ 4. Neste ponto, nós apenas estimar 7: 3 como, digamos, 2: 1, e obter 2 ^ 4: 1 = 16: 1. A nossa resposta final é ainda maior, por isso é definitivamente maior do que 95% ou mais; a resposta certa é em torno de 96,7%. Compare isso com as respostas da maioria das pessoas, que estão na faixa de 70--80%.

Espero que você concorde que os problemas tornam-se muito facilmente, e intuitiva , quando visto sob essa luz.

Eu assumo que a probabilidade 'a priori' de uma hipótese contra o outro é 1/2, e além disso, que tanto os indivíduos reinserir cada bola depois extraí-lo (extrações são independentes um do outro).

A resposta correta é que o segunda observador deve ser mais confiante do que o primeiro. A minha resposta anterior estava errado devido a um erro trivial em cálculos, muito obrigado e um para Adam Rosenfield para sua correção.

Let 2 / 3R 1 / 3W denotar o evento "o urna contém 2/3 de esferas vermelhas e 1/3 bolas brancas", e deixe 4R, 1W denotar o evento "4 bolas vermelhas e uma bola branca começar extraído". Então, usando a regra de Bayes,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = P [ 4R, 1W | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] / P [ 4R, 1W ] = (2/3) 4 (1/3) 1 (02/01) / P [ 4R, 1W ]

Agora, desde 2 / 3R 1 / 3W e 1/2 3R / 3W são complementares por hipótese,

P [ 4R, 1W ] = P [ 4R, 1W | 2 / 3R 1 / 3W ] P [ 2 / 3R 1 / 3W ] + P [ 4R, 1W | 1/2 3R / 3W ] P [ 1/2 3R / 3W ] = (2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2/3 ) 1 (1/2)

Assim,

P [ 2 / 3R 1 / 3W | 4R, 1W ] = (2/3) 4 (1/3) 1 (02/01) / {(2/3) 4 (1 / 3) 1 (1/2) + (1/3) 4 (2/3) 1 (1/2)} = 2 ^ 4 / (2 ^ 4 + 2) = 8/9

O mesmo cálculo para P [ 2 / 3R 1 / 3W | 12R, 8W ] (ou seja, ter (2/3) 12 (1/3) 8 em vez de (2/3) 4 (1/3) 1 ) origina agora 16/17 , portanto, a confiança do segundo observador é maior do que a do primeiro.

P [2 / 3R 1 / 3W | 4R, 1W] = (2/3) * ^ 4 (1/3) ^ 1 * (1/2) / {(2/3) ^ 4 * (1/3) ^ 1 * (1/2) + (1/3) ^ 4 * (2/3) ^ 1 * (1/2)} = 2 ^ 4 / (2 ^ 4 + 1) = 16/17

er,

= ⅔^4*⅓ / (⅔^4*⅓ + ⅓^4*⅔)
= 16/243 / (16/243 + 2/243)
= 16/18

P (?R?W | 12R8W). Faz de fato no entanto = 16/17, de modo que o 12R8W pode ser mais confiante

Hehe. Pode ser que eu sou totalmente errado, mas não é ele intuitiva que resposta deve ser segundo cara?

Vê-se uma proporção: 4: 1 4/5: 1/5

Dois vê uma relação de 3: 1 3/4: 1/4

Assim, pergunta simples é que está mais perto de 2/3: 1/3? Daí a resposta é Obs. Dois.

Pode ser que eu tenha feito dois erros e estou recebendo uma resposta simples para algo complexo, mas desculpem a minha paciência para percorrer longa explicação para o que eu pensei que era realmente intuitiva.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top