Le théorème de Bayes a fait l’objet d’un article détaillé. L’essai est bon, mais il compte plus de 15 000 mots – voici la version condensée pour les nouveaux venus bayésiens comme moi :

Les tests ne sont pas l’occasion. Nous avons un test de maladie, distinct de l’occasion d’avoir vraiment une croissance maligne. Nous avons un test de dépistage du spam, distinct de celui qui permet de savoir si un message de spam a réellement été envoyé.

Les tests sont imparfaits. Les tests reconnaissent des choses qui n’existent pas (faux positif) et ratent des choses qui existent (faux négatif). Les personnes utilisent régulièrement les résultats des tests sans modifier les erreurs.

Les faux positifs faussent les résultats. Supposons que vous recherchiez quelque chose d’extrêmement rare (1 sur un million). En effet, même avec un test décent, tout bien considéré, un résultat positif est extrêmement faussement positif sur une personne dans le 999 999.

Les individus penchent vers des nombres normaux . Le fait de dire “100 sur 10, 000″ au lieu de “1%” aide les individus à travailler sur les chiffres avec moins d’erreurs, en particulier avec de nombreux taux (“Sur ces 100, 80 seront positifs” par opposition à “80% du 1% seront positifs”).

En effet, même la science est un test. Au niveau philosophique, les examens logiques sont des “tests éventuellement imparfaits” et doivent être traités de manière appropriée. Il existe un test pour un composé ou une merveille, et il y a simplement l’occasion de l’émerveillement. Nos tests et notre matériel d’estimation ont un rythme de bévue à représenter. L’hypothèse de Bayes change selon les résultats de votre test en une véritable probabilité de l’occasion. Par exemple, vous pouvez :

Corriger les erreurs de mesure Si vous connaissez les probabilités réelles et la possibilité d’un faux positif et d’un faux négatif, vous pouvez corriger les erreurs d’estimation.

Relier la probabilité réelle à la probabilité délibérée du test. Compte tenu des résultats des tests de mammographie et des taux de bévues réalisés, vous pouvez anticiper la possibilité réelle d’avoir une maladie en cas de test positif. En termes spécialisés, vous pouvez découvrir Pr(H|E), la possibilité qu’une théorie Son véritable donné la preuve E, à partir de Pr(E|H), la possibilité que la preuve se manifeste lorsque la spéculation est valable.

Anatomie d’un test

L’article dépeint une situation de test de maladie :

1 % des femmes ont un cancer du sein (et donc 99 % n’en ont pas).

80 % des mammographies reconnaissent le cancer du sein lorsqu’il est présent (et de cette manière, 20 % le manquent).

9,6 % des mammographies identifient une croissance du cancer du sein lorsqu’il n’est pas présent (et par conséquent 90,4 % donnent effectivement un résultat négatif).

Mises dans un tableau, les probabilités ressemblent à ceci :

Comment le lire ?

1% des individus ont un cancer

Si par hasard vous avez un cancer du sein, vous êtes dans la section principale. Il y a 80 % de chances que votre test soit positif. Il y a 20 % de chances que votre test soit négatif.

Si vous n’avez pas de cancer du sein, vous êtes dans le segment suivant. Il y a une possibilité de 9,6 % que votre test soit positif et une possibilité de 90,4 % qu’il soit négatif.

Quelle est la précision du test ?

Supposez actuellement que vous obtenez un résultat de test positif. Quelles sont les chances que vous ayez un cancer ? 80% ? 99% ? 1% ?

Voici la manière dont je le considère :

Très bien, nous avons obtenu un résultat positif. Cela signifie que nous sommes quelque part dans la première colonne de notre tableau. Nous ne devrions rien accepter – cela pourrait être un vrai positif ou un faux positif.

Les chances d’un vrai positif = chance que vous ayez un cancer * chance que le test l’ait attrapé = 1% * 80% = .008

Les chances d’un faux positif = chance que vous n’ayez pas de cancer * chance que le test l’ait quand même attrapé = 99% * 9,6% = 0,09504

La table ressemble à ceci :

De plus, quelle a été l’enquête une fois de plus ? Gracieuse oui : quelle est la chance que nous ayons vraiment un cancer dans le cas où nous obtiendrions un résultat positif. La possibilité d’une occasion est le nombre de façons dont elle pourrait se produire compte tenu de tous les résultats imaginables :

La possibilité d’obtenir un résultat réel et positif est de 0,008. La possibilité d’obtenir un résultat positif, quel qu’il soit, est la possibilité d’obtenir un résultat véritablement positif, en plus de la possibilité d’obtenir un faux positif (0,008 + 0,09504 = 0,10304).

Ainsi, notre possibilité de maladie est de 0,008/.10304 = 0,0776, soit environ 7,8%.

Intriguant – une mammographie positive signifie simplement que vous avez une possibilité de 7,8 % de malignité, contre 80 % (la prétendue précision du test). Elle peut sembler anormale dès le départ, mais c’est de bon augure : le test donne un faux positif 9,6 % du temps (très élevé), ce qui signifie qu’il y aura de nombreux faux points encourageants dans une population donnée. Pour une maladie peu commune, une grande partie des résultats positifs du test ne seront pas justes.

Et si nous mettions notre instinct à l’épreuve en faisant une déduction à partir d’un simple regard sur la table. Si vous prenez 100 individus, un seul d’entre eux sera atteint de la maladie (1 %) et il sera probablement positif (80 % de possibilité). Sur les 99 individus en suspens, environ 10 % seront positifs, ce qui nous donnera environ 10 faux positifs. Si l’on considère l’ensemble des tests positifs, seul 1 sur 11 a raison, ce qui signifie qu’il y a 1/11 de possibilité d’avoir une croissance maligne en cas de test positif. Le chiffre réel est de 7,8 % (plutôt 1/13, enregistré ci-dessus), mais nous avons trouvé une jauge sensible sans machine à additionner.

Théorème de Bayes

Nous pouvons transformer la procédure ci-dessus en une condition, qui est le théorème de Bayes. Il vous permet de passer en revue les résultats de l’examen et de vous orienter vers le “biais” présenté par les faux positifs. Vous avez la possibilité réelle d’en avoir l’occasion. Voici la condition :

De plus, voici la clé du décodeur pour le lire :

Pr(H|E) = Chance d’avoir un cancer (H) en cas de test positif (E). C’est ce que nous devons savoir : Quelle est la probabilité d’avoir un cancer avec un résultat positif ? Pour notre situation, elle était de 7,8 %.

Pr(E|H) = Chance d’un test positif (E) étant donné que vous avez eu un cancer (H). C’est l’opportunité d’un test réellement positif, 80% pour notre situation.

Pr(H) = Chance d’avoir un cancer (1%).

Pr(not H) = Chance de ne pas avoir de cancer(99%).

Pr(E|non H) = Chance d’un test positif (E) étant donné que vous n’aviez pas de tumeur maligne (non H). C’est un faux positif, 9,6% pour notre situation.

Tout se résume à l’opportunité d’un véritable positif séparé par l’opportunité de tout positif. Nous pouvons améliorer la condition pour :

Le Pr(E) nous révèle la possibilité d’obtenir un résultat positif, qu’il s’agisse d’un vrai positif chez les personnes atteintes de tumeurs malignes (1%) ou d’un faux positif chez les personnes non atteintes (99%). Il agit comme un facteur de pondération, en modifiant les chances d’obtenir un résultat presque certain.

C’est en négligeant de représenter les faux positifs que la faible possibilité de croissance maligne (7,8 %) (en cas de test positif) apparaît étrange. Merci beaucoup à vous, normalisateurs, de nous avoir mis sur la bonne voie !