Bayes’ Theorem war Gegenstand eines ausführlichen Artikels. Der Aufsatz ist gut, aber über 15.000 Wörter lang – hier ist die Kurzfassung für Bayesianische Neulinge wie mich:

Tests sind nicht der Anlass. Wir haben einen Krankheitstest, getrennt von der Gelegenheit, wirklich bösartiges Wachstum zu haben. Wir haben einen Test für Spam, getrennt von der Gelegenheit, wirklich eine Spam-Nachricht zu haben.

Tests sind unvollkommen. Tests erkennen Dinge, die nicht existieren (falsches Positiv) und übersehen Dinge, die es gibt (falsches Negativ). Einzelpersonen verwenden regelmäßig Testergebnisse, ohne Testfehler zu modifizieren.

Falsch-positive Schrägstellungsergebnisse. Angenommen, Sie suchen nach etwas extrem Ungewöhnlichem (1 von einer Million). Tatsächlich ist selbst bei einem anständigen Test, alles in allem, ein positives Ergebnis bei jemandem in der 999.999er Gruppe ein gefälschtes Positiv.

Individuen neigen zu normalen Zahlen . Die Aussage “100 in 10,000″ statt “1%” hilft den Personen, die Zahlen mit weniger Fehlern durchzuarbeiten, insbesondere bei zahlreichen Raten (“Von diesen 100 werden 80 positiv getestet” im Gegensatz zu “80% der 1% werden positiv getestet”).

In der Tat ist sogar die Wissenschaft ein Test. Auf philosophischer Ebene sind logische Prüfungen “möglicherweise unvollkommene Tests” und sollten entsprechend behandelt werden. Es gibt eine Prüfung für eine Verbindung oder ein Wunder, und es gibt einfach den Anlass des Wunders. Unsere Tests und die Schätzung von Hardware haben ein Tempo, das sich als Fehler darstellen lässt. Bayes’ Hypothese wandelt sich über die Ergebnisse Ihres Tests in die tatsächliche Wahrscheinlichkeit des Ereignisses um. Zum Beispiel können Sie:

Korrektur bei Messfehlern Für den unwahrscheinlichen Fall, dass Sie die echten Wahrscheinlichkeiten und die Möglichkeit eines falschen Positivs und Falschnegativs kennen, können Sie auf Schätzfehler hinweisen.

Setzen Sie die tatsächliche Wahrscheinlichkeit in Beziehung zur absichtlichen Testwahrscheinlichkeit. Angesichts der Ergebnisse von Mammographie-Tests und der realisierten Fehlerraten können Sie die reale Möglichkeit voraussehen, dass die Krankheit einen positiven Test erhalten wird. In spezialisierten Begriffen kann man Pr(H|E) entdecken, die Möglichkeit, dass eine Theorie Sein echter gegebener Beweis E, beginnend mit Pr(E|H), die Möglichkeit, dass der Beweis sich zeigt, wenn die Spekulation gültig ist.

Anatomie eines Tests

Der Artikel stellt eine Situation der Krankheitsprüfung dar:

1% der Frauen haben Brustkrebs (und damit 99% nicht).

80% der Mammographien erkennen Brustkrebs, wenn er vorhanden ist (und auf diese Weise verpassen 20% ihn).

9,6 % der Mammographien zeigen Brustkrebswachstum an, wenn es nicht vorhanden ist (und folglich 90,4 % geben effektiv ein negatives Ergebnis zurück).

In eine Tabelle gesetzt, ähneln die Wahrscheinlichkeiten dem:

Wie würden wir es lesen?

1% der Personen haben Krebs

Für den unwahrscheinlichen Fall, dass Sie ab sofort Brustkrebs haben, befinden Sie sich in der Hauptabteilung. Es besteht eine 80-prozentige Wahrscheinlichkeit, dass der Test positiv ausfällt. Es besteht eine 20-prozentige Möglichkeit, dass Sie einen negativen Test durchführen.

Falls Sie keinen Brustkrebs haben, befinden Sie sich im Folgesegment. Es besteht eine 9,6-prozentige Möglichkeit, dass Sie positiv testen, und eine 90,4-prozentige Möglichkeit, dass Sie negativ testen.

Wie genau ist der Test?

Gehen Sie derzeit davon aus, dass Sie ein positives Testergebnis erhalten. Wie stehen die Chancen, dass Sie Krebs haben? 80%? 99%? 1%?

Ich sehe das folgendermaßen:

Gut, wir haben ein positives Ergebnis erzielt. Das bedeutet, dass wir irgendwo in der obersten Spalte unserer Tabelle stehen. Wir sollten nichts akzeptieren – es könnte ein echtes Positiv oder ein Scheinpositiv sein.

Die Chancen auf ein echtes Positiv = Wahrscheinlichkeit, dass Sie Krebs haben * der Zufallstest hat ihn entdeckt = 1% * 80% = .008

Die Wahrscheinlichkeit eines falsch positiven Ergebnisses = die Chance, dass Sie keinen Krebs haben * der Zufallstest hat ihn trotzdem entdeckt = 99% * 9,6% = 0,09504

Die Tabelle sieht wie folgt aus:

Und was war die Untersuchung noch einmal? Gnädiges Ja: was ist die Chance, dass wir wirklich Krebs haben, falls wir ein positives Ergebnis erzielen. Die Möglichkeit eines Ereignisses ist die Anzahl der Möglichkeiten, wie es angesichts jedes einzelnen denkbaren Ergebnisses geschehen könnte:

Die Möglichkeit, ein echtes, positives Ergebnis zu erzielen, liegt bei 0,008. Die Möglichkeit, jede Art von positivem Ergebnis zu erhalten, ist die Möglichkeit eines echten Positivs zusätzlich zu der Möglichkeit eines Scheinpositivs (.008 + 0.09504 = .10304).

Somit ist unsere Möglichkeit einer Erkrankung .008/.10304 = 0,0776, oder etwa 7,8%.

Faszinierend – eine positive Mammographie bedeutet nur, dass Sie eine 7,8%ige Möglichkeit einer bösartigen Erkrankung haben, im Gegensatz zu 80% (die angebliche Präzision des Tests). Es mag von Anfang an anormal erscheinen, aber es verheißt Gutes: Der Test ergibt in 9,6% der Fälle ein falsches Positiv (sehr hoch), so dass es in einer bestimmten Bevölkerung zahlreiche falsche ermutigende Punkte geben wird. Bei einer ungewöhnlichen Krankheit wird ein großer Teil der positiven Testergebnisse nicht stimmen.

Wie wäre es, wenn wir unseren Instinkt testen, indem wir aus dem Blick auf die Tabelle eine Schlussfolgerung ziehen. Falls Sie 100 Personen nehmen, wird nur 1 Person die Krankheit haben (1%), und sie werden wahrscheinlich positiv getestet (80% Möglichkeit). Von den 99 herausragenden Individuen werden etwa 10% positiv getestet, so dass wir etwa 10 falsch positive Ergebnisse erhalten werden. Wenn man an all die positiven Tests denkt, ist nur 1 von 11 richtig, so dass bei einem positiven Test eine 1/11 Möglichkeit besteht, ein bösartiges Wachstum zu haben. Die tatsächliche Zahl beträgt 7,8% (eher 1/13, siehe oben), aber wir haben ein vernünftiges Messgerät ohne Addiermaschine gefunden.

Bayes’sches Theorem

Wir können das obige Verfahren in eine Bedingung umwandeln, die das Bayes’sche Theorem ist. Es gibt Ihnen die Möglichkeit, durch die Prüfungsergebnisse zu gehen und die “Neigung” zu korrigieren, die durch falsch positive Ergebnisse dargestellt wird. Sie erhalten die echte Möglichkeit, die Gelegenheit dazu zu haben. Hier ist die Bedingung:

Außerdem ist hier der Decoderschlüssel, um ihn zu lesen:

Pr(H|E) = Wahrscheinlichkeit, dass der Krebs (H) einen positiven Test (E) erhält. Das ist es, was wir wissen müssen: Wie wahrscheinlich ist es, dass es Krebs mit einem positiven Ergebnis hat? Für unsere Situation betrug sie 7,8 %.

Pr(E|H) = Chance auf einen positiven Test (E), da Sie Krebs haben (H). Dies ist die Chance eines wirklich positiven, 80% für unsere Situation.

Pr(H) = Wahrscheinlichkeit, an Krebs zu erkranken (1%).

Pr(nicht H) = Chance, nicht an Krebs zu erkranken(99%).

Pr(E|nicht H) = Chance auf einen positiven Test (E), da Sie keine Bösartigkeit (nicht H) hatten. Das ist ein falsches Positiv, 9,6% für unsere Situation.

Alles läuft auf die Möglichkeit eines echten Positivs hinaus, getrennt durch die Möglichkeit eines beliebigen Positivs. Wir können den Zustand verbessern:

Pr(E) offenbart uns die Möglichkeit, ein positives Ergebnis zu erzielen, unabhängig davon, ob ein echtes Positiv in der bösartigen Wachstumspopulation (1%) oder ein Scheinpositiv in der nicht krankheitsbedingten Bevölkerung (99%). In wirkt wie ein Gewichtungsfaktor, der die Chancen auf das fast sichere Ergebnis verändert.

Die Vernachlässigung der Darstellung falsch positiver Ergebnisse ist es, die die geringe 7,8%ige Möglichkeit eines bösartigen Wachstums (bei positivem Test) seltsam erscheinen lässt. Vielen Dank an Sie, die Sie sich stetig normalisiert haben, dass Sie uns in Ordnung gebracht haben!