O teorema de Bayes foi o tema de um artigo detalhado. O ensaio é bom, mas com mais de 15.000 palavras – aqui está a versão condensada para os recém-chegados Bayesianos como eu:

Os testes não são a ocasião. Nós temos um teste de doença, separado da ocasião de realmente ter um crescimento maligno. Nós temos um teste para spam, separado da ocasião de realmente ter uma mensagem de spam.

Os testes são imperfeitos. Os testes reconhecem coisas que não existem (falso positivo) e perdem coisas que existem (falso negativo). Os indivíduos usam regularmente os resultados dos testes sem modificar os erros dos testes.

Falsos resultados positivos. Suponha que você esteja procurando algo extremamente incomum (1 de cada milhão). Na verdade, mesmo com um teste decente, tudo considerado, um resultado positivo é extremamente falso positivo em alguém no 999.999.

Os indivíduos inclinam-se para números normais . Dizer “100 em 10,000″ em vez de “1%” ajuda os indivíduos a trabalhar com os números com menos erros, particularmente com numerosas taxas (“Desses 100, 80 serão positivos” em oposição a “80% do 1% será positivo”).

Na verdade, até a ciência é um teste. A um nível filosófico, os exames lógicos são “testes possivelmente imperfeitos” e devem ser tratados adequadamente. Há um teste para um composto ou uma maravilha, e há simplesmente a ocasião da maravilha. Os nossos testes e o hardware de estimação têm um ritmo de erro a ser representado. A hipótese de Bayes muda sobre os resultados do seu teste para a probabilidade genuína da ocasião. Por exemplo, você pode:

Correcto para erros de medição Na hipótese remota de conhecer as probabilidades genuínas e a possibilidade de um falso positivo e um falso negativo, você pode corrigir para erros de estimativa.

Relacionar a probabilidade real com a probabilidade de teste deliberada. Dados os resultados do teste de mamografia e as taxas de erro realizadas, você pode antecipar a possibilidade real de ter a doença dada um teste positivo. Em termos especializados, você pode descobrir o Pr(H|E), a possibilidade de que uma teoria Sua genuína dada prova E, a partir do Pr(E|H), a possibilidade de que a prova aparece quando a especulação é válida.

Anatomia de um teste

O artigo retrata uma situação de teste de doença:

1% das senhoras têm cancro da mama (e, desta forma, 99% não têm).

80% das mamografias reconhecem o cancro da mama quando este existe (e desta forma 20% perdem-no).

9,6% das mamografias identificam o crescimento do cancro da mama quando este não está presente (e consequentemente 90,4% devolvem efectivamente um resultado negativo).

Coloque numa mesa, as probabilidades são semelhantes a isto:

Como o leríamos?

1% dos indivíduos têm cancro

Na hipótese de ter cancro da mama a partir de agora, você está na secção principal. Há uma possibilidade de 80% de você dar positivo. Há 20% de possibilidade de que você dê negativo.

Caso você não tenha câncer de mama, você está no segmento subsequente. Há uma possibilidade de 9,6% de que o teste seja positivo, e 90,4% de que o teste seja negativo.

Qual é a precisão do teste?

Presume-se actualmente que o resultado do teste seja positivo. Quais são as chances de você ter câncer? 80%? 99%? 1%?

Aqui está a maneira pela qual eu considero isso:

Muito bem, temos um resultado positivo. Significa que estamos em algum lugar na coluna superior da nossa mesa. Não devemos aceitar nada – pode ser um verdadeiro positivo ou um falso positivo.

As chances de um verdadeiro positivo = chance de você ter câncer * o teste de chance pegou = 1% * 80% = .008

As chances de um falso positivo = chance de você não ter câncer * teste de chance pegou de qualquer forma = 99% * 9,6% = 0,09504

A mesa é parecida com esta:

E mais, qual foi mais uma vez o inquérito? Gracioso sim: qual é a oportunidade de realmente termos câncer no caso de termos um resultado positivo. A possibilidade de uma ocasião é o número de maneiras que ela pode acontecer, dado cada um dos resultados imagináveis:


A possibilidade de obter um resultado genuíno e positivo é .008. A possibilidade de obter qualquer tipo de resultado positivo é a oportunidade de um resultado positivo genuíno, além da possibilidade de um falso positivo (.008 + 0.09504 = .10304).

Assim, nossa possibilidade de doença é 0,008/.10304 = 0,0776, ou cerca de 7,8%.

Intrigante – uma mamografia positiva apenas significa que você tem uma possibilidade de 7,8% de malignidade, em oposição a 80% (a suposta precisão do teste). Pode parecer anormal desde o início, mas é um bom presságio: o teste dá um falso positivo de 9,6% do tempo (muito alto), por isso haverá numerosos pontos falsos de encorajamento numa determinada população. Para uma doença pouco comum, uma grande parte dos resultados positivos do teste não será correta.

Que tal testarmos o nosso instinto, fazendo uma inferência basicamente de olhar para a mesa. No caso de se tomar 100 indivíduos, apenas 1 indivíduo terá a doença (1%), e eles provavelmente vão testar positivo (80% de possibilidade). Dos 99 indivíduos que se destacam, cerca de 10% irão testar positivo, por isso vamos obter aproximadamente 10 falsos positivos. Pensando em todos os testes positivos, apenas 1 de cada 11 está certo, então há uma possibilidade de 1/11 de ter um crescimento maligno dado um teste positivo. O número genuíno é 7,8% (mais parecido com 1/13, registrado acima), no entanto, encontramos um indicador sensato sem uma máquina de adição.

Teorema de Bayes

Podemos transformar o procedimento acima em uma condição, que é o Teorema de Bayes. Ele lhe dá a chance de passar pelos resultados do exame e direito para o “slant” apresentado por falsos positivos. Você tem a possibilidade genuína de ter a ocasião. Aqui está a condição:

E mais, aqui está a chave do descodificador para a ler:

Pr(H|E) = Possibilidade de ter cancro (H) dado um teste positivo (E). Isto é o que nós precisamos saber: Qual é a probabilidade de ter cancro com um resultado positivo? Para a nossa situação, foi de 7,8%.

Pr(E|H) = Chance de um teste positivo (E) dado que você teve câncer (H). Esta é a oportunidade de um teste genuinamente positivo, 80% para a nossa situação.

Pr(H) = Possibilidade de ter cancro (1%).

Pr(não H) = Possibilidade de não ter cancro(99%).

Pr(E|não H) = Chance de um teste positivo (E) dado que você não teve malignidade (não H). Isto é um falso positivo, 9,6% para a nossa situação.

Tudo se resume à oportunidade de um genuíno positivo separado pela oportunidade de qualquer positivo. Nós podemos melhorar a condição para:

Pr(E) nos revela a possibilidade de obter qualquer resultado positivo, independentemente de ser um positivo genuíno na população de crescimento maligno (1%) ou um positivo falso na população sem-doença (99%). Em atos como um fator de ponderação, modificando as chances de se obter um resultado quase certo.

Negligenciar representar falsos positivos é o que faz com que a baixa possibilidade de 7,8% de crescimento maligno (dado um teste positivo) pareça ser estranha. Muito obrigado a você, normalizando constante, por nos separar!