Eine Stichprobenverteilung ist eine Wahrscheinlichkeitsverteilung einer Statistik, die durch eine große Anzahl von Stichproben aus einer bestimmten Grundgesamtheit erhalten wird. Die Stichprobenverteilung einer bestimmten Grundgesamtheit ist die Verteilung der Häufigkeiten einer Reihe unterschiedlicher Ergebnisse, die möglicherweise für eine Bevölkerungsstatistik auftreten könnten.

Verstehen der Stichprobenverteilung

Viele Daten, die von Akademikern, Statistikern, Forschern, Marketing, Analysten usw. verarbeitet und verwendet werden, sind eigentlich Stichproben und keine Grundgesamtheiten. Eine Stichprobe ist eine Teilmenge einer Grundgesamtheit. Zum Beispiel kann ein medizinischer Forscher, der das Durchschnittsgewicht aller Kinder, die in Nordamerika zwischen 1995 und 2005 geboren wurden, mit dem Durchschnittsgewicht aller Kinder vergleichen will, die im gleichen Zeitraum in Südamerika geboren wurden, nicht innerhalb eines vernünftigen Zeitraums Daten für die gesamte Bevölkerung von mehr als einer Million Geburten in zehn Jahren extrahieren. Stattdessen wird er nur das Gewicht von beispielsweise 100 Kindern auf jedem Kontinent heranziehen, um eine Schlussfolgerung zu ziehen. Als Stichprobe wird das Gewicht von 200 Kindern verwendet und das berechnete Durchschnittsgewicht ist der Durchschnitt der Stichprobe.

Nehmen wir nun an, dass der medizinische Forscher, anstatt nur eine Stichprobe von 100 Babygewichten von jedem Kontinent zu nehmen, wiederholt Zufallsstichproben aus der Allgemeinbevölkerung nimmt und den Durchschnitt der Stichprobe für jede Stichprobengruppe berechnet. So extrahiert er für Nordamerika Daten aus 100 Säuglingsgewichten, die in den Vereinigten Staaten, Kanada und Mexiko aufgezeichnet wurden, wie folgt: vier 100 Proben aus ausgewählten Krankenhäusern in den Vereinigten Staaten, fünf 70 Proben aus Kanada und drei 150 Datensätze aus Mexiko, also insgesamt 1200 Säuglingsgewichte, gruppiert in 12 Gruppen. Ausserdem wird eine Datenstichprobe von 100 Geburtsgewichten aus jedem der 12 südamerikanischen Länder erhoben.

Das für jeden Stichprobensatz berechnete Durchschnittsgewicht ist die Stichprobenverteilung des Durchschnitts. Der Durchschnitt kann nicht nur aus einer Stichprobe berechnet werden. Aus den Stichprobendaten können auch andere Statistiken wie Standardabweichung, Varianz, Anteil und Spannweite berechnet werden. Die Standardabweichung und die Varianz messen die Variabilität der Stichprobenverteilung.

Die Anzahl der Beobachtungen in einer Grundgesamtheit, die Anzahl der Beobachtungen in einer Stichprobe und das zur Ziehung der Stichprobensätze verwendete Verfahren bestimmen die Variabilität einer Stichprobenverteilung. Die Standardabweichung einer Stichprobenverteilung wird als Standardfehler bezeichnet. Während der Mittelwert einer Stichprobenverteilung gleich dem Bevölkerungsdurchschnitt ist, hängt der Standardfehler von der Standardabweichung der Grundgesamtheit, dem Grundgesamtheitsgrad und dem Stichprobenumfang ab.

Wenn man weiß, wie unterschiedlich der Durchschnitt der einzelnen Stichprobensätze von den anderen und dem Bevölkerungsdurchschnitt ist, kann man einen Hinweis darauf erhalten, wie nahe der Stichprobendurchschnitt am Bevölkerungsdurchschnitt liegt. Der Standardfehler der Stichprobenverteilung nimmt mit zunehmendem Stichprobenumfang ab.

Besondere Erwägungen

Eine Grundgesamtheit oder eine Reihe von Stichprobennummern hat eine Normalverteilung. Da eine Stichprobenverteilung jedoch mehrere Sätze von Beobachtungen umfasst, wird sie nicht unbedingt die Form einer Glockenkurve haben.

Unserem Beispiel folgend hat das Durchschnittsgewicht der Kinderpopulation in Nord- und Südamerika eine Normalverteilung, weil einige Kinder untergewichtig (unterdurchschnittlich) oder übergewichtig (überdurchschnittlich) sein werden, während die meisten Kinder dazwischen liegen (etwa im Durchschnitt). Wenn das Durchschnittsgewicht der Säuglinge in Nordamerika sieben Pfund beträgt, wird das durchschnittliche Probengewicht in jeder der 12 für Nordamerika aufgezeichneten Beobachtungsreihen ebenfalls nahe bei sieben Pfund liegen.

Wenn Sie jedoch den Graphen für jeden der Mittelwerte, die in jeder der 1.200 Probengruppen berechnet wurden, auftragen, kann die resultierende Form zu einer gleichmäßigen Verteilung führen, aber es ist schwierig, mit Sicherheit vorherzusagen, wie die tatsächliche Form aussehen wird. Je mehr Stichproben der Forscher aus einer Grundgesamtheit von über einer Million Gewichtsziffern verwendet, desto mehr wird die Grafik eine Normalverteilung zu bilden beginnen.