Mit Hilfe eines Box-Plots oder Box-and-Whisker-Plots können Sie die Verteilung der Datenbank in einer fünfstelligen Zusammenfassung darstellen. Das erste Quartil Q1 ist das Minimum, das dritte Quartil Q3 ist der Median und das fünfte Quartil Q5 ist das Maximum. Sie können die Ausreißer und ihre Werte mit Hilfe eines Boxplots finden. Sie können auch erkennen, ob Ihre Daten symmetrisch sind oder nicht und ob sie in einer Gruppe eng oder weit auseinander liegen, oder ob Sie schiefe Daten haben.
Was ist ein Box-Plot?
Ein Box- und Whisker-Plot enthält Linien und Kästen, um die Daten in verschiedene numerische Gruppen zu unterteilen. 50 % der zentralen Daten werden um die zentrale Linie der Box herum liegen. Dieser Wert ist der Median. Die Linien werden die restlichen Daten erfassen, indem sie sich von jeder Box aus erstrecken. Die gestrichelten Linien, die Sie um die Linienränder legen, werden die Ausreißer sein.
Einige wichtige Begriffe, die Sie kennen sollten:
– Mindestpunktzahl
Der Minimalwert ist der niedrigste Wert und schließt Ausreißer nicht ein. Diese Spalte befindet sich am Ende des linken Whiskers.
– Unteres Quartil
Im unteren Quartilswert finden Sie fünfundzwanzig Prozent der Scores. Dies ist das erste Quartil.
– Median
Der Median ist der Mittelwert der Daten. Sie stellen ihn durch eine Linie dar, die das Feld in zwei Hälften teilt. Sie können dies auch als das zweite Quartil bezeichnen. Die Hälfte der Werte ist kleiner als der Median, die andere Hälfte ist größer oder gleich.
– Oberes Quartil
Unterhalb des oberen oder dritten Quartilwertes liegen fünfundsiebzig Prozent der Daten. Die restlichen Daten, d. h. 25 % der Daten, liegen oberhalb dieses Wertes.
– Maximale Punktzahl
Am Ende des rechten Whiskers finden Sie den höchsten Wert. Dieser Bereich schließt Ausreißer nicht aus.
– Whisker
Die oberen 25 % und die unteren 25 % der Scores werden Scores außerhalb der mittleren 50 % darstellen.
– Der Interquartilsbereich (oder IQR)
Der Interquartilsbereich des Boxdiagramms zeigt die mittleren 50 % an. Dieser mittlere Bereich umfasst Daten von 25 Prozent bis 75 Prozent.
Box-Plot-Beispiel: Ermitteln der fünfstelligen Zusammenfassung
Hier sind die Gewichte der Stichprobe von 101010 Schachteln mit Rosinen. Die Maßeinheit wäre Gramm. Sie müssen die fünfstellige Summe dieser Rosinenkisten finden.
303030, 292929, 373737, 353535, 383838, 373737, 353535, 282828, 252525, 343434
Erstellen Sie ein Boxplot der Daten
Schritt 1
Ordnen Sie alle Datenpunkte beginnend vom kleinsten zum größten an. Wir können also damit beginnen, die Daten anzuordnen:
252525, 282828, 292929, 303030, 343434, 353535, 353535, 373737, 373737, 383838
Schritt 2
Jetzt müssen Sie den Median finden. Um es einfach zu halten, ist der Median die mittleren zwei Zahlen. Unser Median in diesen Daten wäre also:
252525, 282828, 292929, 303030, “groß (34)3434”, “groß (35)3535”, 353535, 373737, 373737, 383838
\dfrac(30+34)(2)
=32+34 / 2 =32
Dies bedeutet, dass der Median 323232 sein würde
Schritt 3
Sie müssen die Quartile finden. Sie betrachten das erste Quartil als Median der Datenpunkte. Sie beginnen mit dem Median links.
252525, 282828, \large(29)2929, 303030
Q_1 = 29
Q1 = 29Q
Der tiefgestellte Anfangsbuchstabe ist 1, und der tiefgestellte Endbuchstabe ist 29.
Der Median des Datenpunkts ist das dritte Quartil, und die Position befindet sich rechts vom Median.
343434, 353535, 353535, \large(37)3737, 373737, 383838
Q_3=37
Q3=37Q
Der Anfangsbuchstabe ist drei, und der Endbuchstabe ist 37.
Schritt 4
Vervollständigen Sie nun die Fünf-Zahlen-Zusammenfassung und finden Sie den maximalen und minimalen Wert der Box.
Der kleinste Datenpunkt wird der Minimalwert sein. Im obigen Boxplot-Beispiel ist das der Wert 252525.
Der umfangreichste Datenpunkt ist der Maximalwert. Im obigen Box-Diagramm ist dies der Wert 383838.
Daher lautet die fünfstellige Zusammenfassung:
252525, 292929, 323232, 373737, 383838
Vergleich des Box- und Whisker-Plots
Ein Box- und Whisker-Plot ermöglicht es Ihnen, Unterschiede zwischen verschiedenen Gruppen und Stichproben zu visualisieren. Durch den Vergleich des Box- und Whisker-Diagramms können Sie wesentliche statistische Informationen erhalten, wie z. B. Ausreißer, Bereiche und Mediane.
Schritt 1: Vergleich der Mediane
Sie müssen die Mediane der einzelnen Boxen vergleichen. Wenn die Medianlinie nicht innerhalb der Box liegt, sind die beiden Gruppen unterschiedlich.
Schritt 2: Vergleich der Whisker und Interquartilsbereiche von Box-Plots
Sie müssen die Boxlängen der Interquartilsbereiche vergleichen. Auf diese Weise können Sie die Daten und deren Streuung zwischen den Stichproben analysieren. Die Streuung der Daten hängt von der Länge der Box ab. Auf der anderen Seite wird die Streuung bei einer kleinen Anzahl von Daten begrenzt sein.
Sie müssen die Gesamtstreuung zwischen zwei Whiskern überprüfen, da sie Extremwerte anzeigt. Außerdem zeigt es den Bereich der Werte, was eine andere Art der Dispersion ist. Wenn die Bereiche umfangreich sind, entdecken Sie eine breitere Verteilung. Dadurch werden die Daten noch mehr gestreut.
Schritt 3: Suche nach den potenziellen Ausreißern
Wenn Sie eine Boxplot-Überprüfung durchführen, betrachten Sie den Ausreißer als Datenpunkt. Der Ort dieses Datenpunktes wird außerhalb der Whisker liegen.
Schritt 4: Suche nach Anzeichen von Schrägheit
Nun müssen Sie nach dem Aussehen der Daten suchen. Prüfen Sie, ob sie symmetrisch sind oder nicht. Gehen Sie jede Stichprobe durch und suchen Sie die gleiche Art von Asymmetrie.
Fazit
Mit Hilfe eines Boxplots können Sie eine fünfstellige Zusammenfassung im Diagramm darstellen. Der Hauptzweck des Diagramms ist es, den mittleren Teil der Daten zu zeigen. Dieser mittlere Teil ist der Interquartilsbereich. Sie finden das erste Quartil am Ende der Box bei der 25 %-Marke und bei der 75 %-Marke finden Sie das dritte Quartil.
Sie fügen das Minimum an den fünf linken Bereichen des Diagramms hinzu. Dieses erscheint auf dem linken Whisker am Ende. Das Minimum ist die kleinste Zahl, während das Maximum, das sich ganz rechts befindet, die größte Zahl ist. In der Mitte der Box finden Sie den Median. Sie müssen sich den vertikalen Balken ansehen, um den Median zu finden. Sie werden das Box- und Whisker-Diagramm im wirklichen Leben nicht oft verwenden. Dennoch können Sie das Werkzeug verwenden, um eine schnelle Zusammenfassung der Daten zu finden.