Die Wahrscheinlichkeit beginnt mit einem Tier und entscheidet, welche Fußabdrücke es hinterlassen wird.
Statistik bedeutet, einen Fußabdruck zu sehen und das Tier zu erraten.
Die Wahrscheinlichkeit ist ganz einfach: Sie haben den Bären. Messen Sie die Fußgröße, die Beinlänge, und Sie leiten die Fußabdrücke ab. “Oh, Mr. Bubbles wiegt 400 Pfund und hat 3-Fuß-Beine und kann solche Spuren machen.” Eher akademisch: “Wir haben eine gute Münze. Nach 10 Flips sind hier die möglichen Ergebnisse.”
Statistik ist schwieriger. Wir messen die Fußabdrücke und müssen raten, um welches Tier es sich handeln könnte. Ein Bär? Ein Mensch? Wenn wir 6 Köpfe und 4 Schwänze erhalten, wie hoch sind die Wahrscheinlichkeiten für eine gute Münze?
Die üblichen Verdächtigen
So “finden wir das Tier” mit Statistiken:
Holen Sie sich die Spuren. Jedes bisschen Wissen kann ein Punkt in “connect the dots” sein. Je mehr Daten, desto klarer wird die Form (1 Punkt in “verbinde die Punkte” ist nicht hilfreich. Ein Datum macht es schwer, einen Trend zu finden).
Messen Sie die wesentlichen Merkmale. Jeder Fußabdruck weist eine Tiefe, Breite und Höhe auf. Jeder Datensatz weist einen Mittelwert, einen Median, eine Varianz usw. auf. Diese universellen, generischen Beschreibungen bieten eine grobe Eingrenzung: “Der Fußabdruck ist 6 Zoll breit: ein kleiner Bär oder ein übergroßer Mann?
Finden Sie die Art. Es gibt Dutzende von möglichen Tieren (Wahrscheinlichkeitsverteilungen), über die man nachdenken kann. Wir grenzen sie mit Vorkenntnissen des Systems ein. innerhalb des Waldes? Denken Sie an Pferde, nicht an Zebras. Umgang mit Ja/Nein-Fragen? Betrachten Sie eine Bernoulli-Verteilung .
Schlagen Sie das genaue Tier nach. Sobald wir die Verteilung (“Bären”) haben, schauen wir unsere allgemeinen Messungen in einer Tabelle nach. “Ein 6 Inch breiter, 2 Inch tiefer Pfotenabdruck ist vermutlich ein 3 Jahre alter, 400 Pfund schwerer Bär”. Die Nachschlagetabelle wird aus der Wahrscheinlichkeitsverteilung generiert, d.h. Messungen werden durchgeführt, wenn sich das Tier innerhalb des Zoos befindet.
Machen Sie zusätzliche Vorhersagen. Sobald wir alle das Tier kennen, werden wir zukünftiges Verhalten und andere Merkmale vorhersagen (“Nach unseren Berechnungen wird Mr. Bubbles im Wald kacken.”). Die Statistik hilft uns dabei, Informationen über die Herkunft der Info zu erhalten, und zwar aus der Info selbst.
Okay! Die Metapher ist nicht perfekt, aber schmackhafter als “Statistik ist, dass das Studium der Sammlung, Organisation, Analyse und Interpretation von Daten”. Brauchen Sie Beweise? Dann lassen Sie uns prüfen, ob wir intuitive “Ich hab’s geschmeckt” Fragen stellen werden:
Welches sind die am häufigsten vorkommenden Arten? (Häufige Verbreitungen)
Werden neue entdeckt?
Können wir den späteren Fußabdruck vorhersagen? (Hochrechnung)
Folgen die Spuren einem Pfad? (Regressions-/Trendlinie)
Hier sind zwei Spuren, welches Tier war schneller? Größer? (Daten aus zwei Medikamentenversuchen: Welches war wirksamer?)
Ist eine Tierbesetzung eine gleichwertige Richtung wie eine andere? (Korrelation)
Verfolgen zwei Tiere eine Standardquelle? (Ursache: zwei Bären jagen ein gleichwertiges Kaninchen)