Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

El teorema de Bayes fue objeto de un detallado artículo. El ensayo es bueno, pero tiene más de 15.000 palabras. Aquí está la versión resumida para los recién llegados bayesianos como yo:

Las pruebas no son la ocasión. Tenemos una prueba de enfermedad, separada de la ocasión de tener realmente un crecimiento maligno. Tenemos una prueba para el spam, aparte de la ocasión de tener realmente un mensaje de spam.

Las pruebas son imperfectas. Las pruebas reconocen cosas que no existen (falso positivo) y pasan por alto cosas que sí existen (falso negativo). Las personas utilizan regularmente los resultados de las pruebas sin modificar los errores de las mismas.

Los falsos positivos distorsionan los resultados. Asume que estás buscando algo extremadamente poco común (1 de cada millón). De hecho, incluso con una prueba decente, considerando todas las cosas, un resultado positivo es extremadamente un falso positivo para alguien en el 999.999.

Los individuos se inclinan hacia los números normales. Decir “100 en 10,000″ en lugar de “1%” ayuda a los individuos a trabajar con los números con menos errores, particularmente con numerosas tasas (“De esos 100, 80 darán positivo” en lugar de “80% del 1% darán positivo”).

De hecho, incluso la ciencia es una prueba. A nivel filosófico, los exámenes lógicos son “pruebas posiblemente imperfectas” y deben ser tratados de manera apropiada. Hay una prueba para un compuesto o una maravilla, y está simplemente la ocasión de la maravilla. Nuestras pruebas y el hardware de estimación tienen un ritmo de error para ser representados. La hipótesis de Bayes cambia sobre los resultados de su prueba en la genuina probabilidad de la ocasión. Por ejemplo, puedes:

Corregir los errores de medición En la remota posibilidad de que conozca las probabilidades genuinas y la posibilidad de un falso positivo y falso negativo, puede dirigirse a los errores de estimación.

Relacionar la probabilidad real con la probabilidad de la prueba deliberada. Dados los resultados de las pruebas de mamografía y los índices de errores cometidos, se puede anticipar la posibilidad real de que la enfermedad dé un resultado positivo. En términos especializados, se puede descubrir Pr(H|E), la posibilidad de que una teoría Su genuina prueba dada E, a partir de Pr(E|H), la posibilidad de que la prueba aparece cuando la especulación es válida.

Anatomía de una prueba

El artículo describe una situación de pruebas de enfermedades:

El 1% de las mujeres tiene cáncer de mama (y de esta manera el 99% no lo tiene).

El 80% de las mamografías reconocen el cáncer de mama cuando está ahí (y de esta manera el 20% lo pasan por alto).

El 9,6% de las mamografías identifican el crecimiento del cáncer de mama cuando no existe (y, por consiguiente, el 90,4% efectivamente devuelve un resultado negativo).

Ponga en una tabla, las probabilidades se parecen a esto:

¿Cómo lo leeríamos?

El 1% de los individuos tienen cáncer

En la remota posibilidad de que tengas cáncer de mama, estás en la sección principal. Hay un 80% de posibilidades de que dé positivo. Hay un 20% de posibilidades de que dé negativo.

En el caso de que no tengas cáncer de mama, estás en el segmento siguiente. Hay un 9,6% de posibilidades de que dé positivo, y un 90,4% de posibilidades de que dé negativo.

¿Cuánta precisión tiene la prueba?

Actualmente asumimos que el resultado de la prueba es positivo. ¿Cuáles son las probabilidades de que tengas cáncer? 80%? 99%? 1%?

Esta es la manera en que lo considero:

Muy bien, tenemos un resultado positivo. Significa que estamos en algún lugar de la columna superior de nuestra mesa. No deberíamos aceptar nada, podría ser un positivo genuino o un positivo falso.

Las posibilidades de un verdadero positivo = posibilidad de tener cáncer * prueba de oportunidad lo detectó = 1% * 80% = .008

Las posibilidades de un falso positivo = posibilidad de no tener cáncer * la prueba de azar lo detectó de todos modos = 99% * 9.6% = 0.09504

La mesa se ve así:

Es más, ¿cuál fue la investigación una vez más? Gracioso sí: cuál es la oportunidad de que realmente tengamos cáncer en caso de que tengamos un resultado positivo. La posibilidad de una ocasión es el número de formas en que podría suceder dado cada resultado imaginable:

La posibilidad de obtener un resultado genuino y positivo es de 0,008. La posibilidad de obtener cualquier tipo de resultado positivo es la oportunidad de un positivo genuino además de la posibilidad de un positivo falso (.008 + 0.09504 = .10304).

Por lo tanto, nuestra posibilidad de enfermedad es de .008/.10304 = 0.0776, o alrededor del 7.8%.

Intrigante – una mamografía positiva sólo significa que tienes un 7,8% de posibilidad de malignidad, frente al 80% (la supuesta precisión de la prueba). Puede parecer anormal desde el principio, pero es un buen augurio: la prueba da un falso positivo el 9,6% de las veces (muy alto), por lo que habrá numerosos puntos falsos alentadores en una población determinada. Para una enfermedad poco común, una gran parte de los resultados positivos de las pruebas no serán correctos.

¿Qué tal si ponemos a prueba nuestro instinto haciendo una inferencia básicamente mirando a la mesa. En el caso de que tomes 100 individuos, sólo 1 individuo tendrá la enfermedad (1%), y probablemente dará positivo (80% de posibilidad). De los 99 individuos sobresalientes, cerca del 10% darán positivo, así que tendremos aproximadamente 10 falsos positivos. Pensando en todas las pruebas positivas, sólo 1 de cada 11 tiene razón, así que hay una posibilidad de 1/11 de tener un crecimiento maligno si la prueba es positiva. El número genuino es 7,8% (más bien 1/13, registrado arriba), sin embargo, encontramos un medidor sensato sin una máquina de sumar.

Teorema de Bayes

Podemos transformar el procedimiento anterior en una condición, que es el Teorema de Bayes. Te da la oportunidad de revisar los resultados de los exámenes y la “inclinación” que presentan los falsos positivos. Tienes la posibilidad genuina de tener la ocasión. Esta es la condición:

Además, aquí está la llave decodificadora para leerlo:

Pr(H|E) = Probabilidad de tener cáncer (H) con una prueba positiva (E). Esto es lo que necesitamos saber: ¿Qué probabilidad hay de tener un cáncer con un resultado positivo? Para nuestra situación, era el 7,8%.

Pr(E|H) = Probabilidad de un test positivo (E) dado que tuviste cáncer (H). Esta es la oportunidad de un genuino positivo, 80% para nuestra situación.

Pr(H) = Probabilidad de tener cáncer (1%).

Pr(no H) = Probabilidad de no tener cáncer(99%).

Pr(E|no H) = Probabilidad de un test positivo (E) dado que no has tenido una malignidad (no H). Esto es un falso positivo, 9,6% para nuestra situación.

Todo se reduce a la oportunidad de un genuino positivo separado por la oportunidad de cualquier positivo. Podemos mejorar la condición para:

Pr(E) nos revela la posibilidad de obtener cualquier resultado positivo, independientemente de si es un positivo genuino en la población de crecimiento maligno (1%) o un positivo falso en la población no enferma (99%). En actúa como un factor de ponderación, modificando las posibilidades hacia el resultado casi seguro.

El hecho de no representar falsos positivos es lo que hace que la baja posibilidad del 7,8% de crecimiento maligno (si la prueba resulta positiva) parezca extraña. ¡Muchas gracias a ti, normalizador constante, por habernos arreglado!

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.