In der deskriptiven Statistik ist ein Box-Plot oder Boxplot eine Methode zur grafischen Darstellung von Gruppen numerischer Daten durch ihre Quartile. Box-Plots können auch vertikal von den Boxen ausgehende Linien (Whisker) aufweisen, die die Variabilität außerhalb des oberen und unteren Quartils anzeigen, daher die Begriffe Box-and-Wisker-Plot und Box-and-Wisker-Diagramm. Ausreißer können als einzelne Punkte aufgetragen werden. Box-Plots sind nicht-parametrisch: Sie zeigen die Variation in den Stichproben einer statistischen Grundgesamtheit an, ohne Annahmen über die zugrunde liegende statistische Verteilung zu treffen (obwohl in Tukys Boxplot Symmetrie für die Schnurrhaare und Normalität für deren Länge angenommen wird). Die Abstände zwischen den verschiedenen Teilen des Kastens geben den Grad der Streuung (Ausbreitung) und Schiefe der Daten an und zeigen Ausreißer an. Zusätzlich zu den Punkten selbst ermöglichen sie die visuelle Schätzung verschiedener L-Schätzer, insbesondere des Interquartils, der Mücke, der Reichweite, des Mittelbereichs und des Trimas. Box-Plots können entweder horizontal oder vertikal gezeichnet werden. Die Kistenparzellen erhielten ihren Namen von der Kiste in der Mitte.

Arten

Abbildung 2. Boxplot mit Schnurrhaaren von Minimum bis Maximum

Abbildung 3. Derselbe Boxplot mit Schnurrhaaren mit maximal 1,5 IQR

Kasten- und Schnurrhaarkurven stellen Quartile dar, und das Band innerhalb des Kastens ist immer das zweite Quartil (der Median). Aber die Enden der Schnurrhaare können mehrere mögliche alternative Werte darstellen, unter anderem:

das Minimum und das Maximum aller Daten[1] (wie in Abbildung 2)

das niedrigste Datum noch innerhalb von 1,5 IQR des unteren Quartils und das höchste Datum noch innerhalb von 1,5 IQR des oberen Quartils (oft als Tukey-Bock-Plot bezeichnet) (wie in Abbildung 3)

eine Standardabweichung über und unter dem Mittelwert der Daten das 9. Perzentil und das 91. Perzentil das 2. Perzentil und das 98. Perzentil.

Alle Daten, die sich nicht zwischen den Schnurrhaaren befinden, sollten als Ausreißer mit einem Punkt, einem kleinen Kreis oder einem Stern aufgetragen werden, aber gelegentlich wird dies nicht getan.

Einige Box-Plots enthalten ein zusätzliches Zeichen, um den Mittelwert der Daten darzustellen.

Bei einigen Kastendiagrammen wird vor dem Ende des Schnurrhaars eine Kreuzschraffur auf jedem Schnurrhaar angebracht.

In den seltensten Fällen können Box Plots ganz ohne Schnurrbart präsentiert werden.

Aufgrund dieser Variabilität ist es angemessen, die Konvention zu beschreiben, die für die Schnurrhaare und Ausreißer in der Bildunterschrift für die Handlung verwendet wird.

Die ungewöhnlichen Perzentile 2%, 9%, 91%, 98% werden manchmal für Schnurrhaarkreuzschraffuren und Schnurrhaarenden verwendet, um die siebenstellige Zusammenfassung zu zeigen. Wenn die Daten normal verteilt sind, sind die Positionen der sieben Markierungen auf dem Box-Plot gleich weit voneinander entfernt.

Der Grundtyp der Fallhandlung, bei der ein Behälter zur Weitergabe des Interquartils verwendet wird, wurde 1952[6] und 1969[7] von Mary Eleanor Spear vorgestellt.

Seit der Mathematiker John W. Tukey 1969 diese Art von visueller Informationsshow vorangetrieben hat, wurden einige geringfügige Abweichungen von der üblichen Kastendarstellung dargestellt. Zwei der bekanntesten sind Box-Plots mit variabler Breite und gepunktete Box-Plots (siehe Abbildung 4).

Kastendiagramme mit variabler Breite beschreiben die Größe jeder Sammlung, deren Informationen dargestellt werden, indem die Breite des Falles relativ zur Größe der Sammlung gemacht wird. Eine Mainstream-Show ist es, die Containerbreite relativ zum quadratischen Fundament der Gruppengröße zu machen.[1]

Bewertete Kastendiagramme wenden eine “Einrückung” oder Verengung des Gehäuses um die Mitte an. Partituren sind hilfreich, um eine unangenehme Anleitung zur Unterscheidung von Medianen zu bieten; wenn die Einzüge zweier Kästchen nicht abdecken, bietet dies den Beweis für einen messbar kritischen Kontrast zwischen den Medianen.[1] Die Breite der Einzüge entspricht der Interquartilsausdehnung (IQR) des Beispiels und umgekehrt relativ zum quadratischen Fundament der Größe des Beispiels. Wie dem auch sei, es gibt eine Schwachstelle in Bezug auf den geeignetsten Multiplikator (da sich dies je nach der Ähnlichkeit der Unterschiede der Beispiele ändern kann)

 Eine Konvention ist die Verwendung von

Der Containerplot erlaubt eine schnelle grafische Auswertung von mindestens einem Informationsindex. Box-Plots können grober erscheinen als ein Histogramm oder ein Bitdickenmessgerät, aber sie haben einige interessante Punkte. Sie nehmen weniger Platz ein und sind in dieser Hinsicht besonders wertvoll, um die Verbreitung zwischen einigen wenigen Zusammenkünften oder Informationsgruppen zu untersuchen (siehe Abbildung 1 für ein Modell). Die Entscheidung über die Anzahl und Breite der Behältersysteme kann das Vorhandensein eines Histogramms intensiv beeinflussen, und die Entscheidung über die Übertragungsgeschwindigkeit kann das Vorhandensein eines Stückdickenmessers stark beeinflussen.

Da ein Blick auf eine messbare Streuung typischer ist als ein Blick auf einen Containerplot, könnte ein Vergleich des Falldiagramms mit der Wahrscheinlichkeitsdickenarbeit (hypothetisches Histogramm) für eine gewöhnliche N(0,σ2)-Zirkulation ein wertvolles Instrument zum Verständnis des Falldiagramms sein (Abbildung 5).