Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

В описательной статистике бокс-график или бокплот – это метод графического отображения групп числовых данных через их квартили. Графики боксов могут также иметь линии, простирающиеся вертикально от боксов (усов), указывающие на изменчивость вне верхнего и нижнего квартилей, отсюда и термины “график боксов и усов” и “график боксов и усов”. Излишки могут быть нанесены в виде отдельных точек. Графики ящиков непараметричны: они отображают вариативность в выборках статистической популяции, не делая никаких предположений об исходном статистическом распределении (хотя бо-глот Тьюки предполагает симметрию для усов и нормальность для их длины). Расстояния между различными частями ящика указывают на степень дисперсии (распространения) и асимметрии в данных, а также показывают отклонения. В дополнение к самим точкам они позволяют визуально оценить различные L-оценщики, в частности, межквартильный диапазон, срединный диапазон, диапазон, средний диапазон и тримеан. Графики могут быть нарисованы как по горизонтали, так и по вертикали. Графики ящиков получили свое название от ящика посередине.

Типы

Рисунок 2. Бокплот с усами от минимума до максимума

Рисунок 3. Тот же Boxplot с усами с максимальным IQR 1.5.

Сюжеты коробки и вискового сюжета являются квартилями, а полоса внутри коробки всегда является вторым квартилем (медианой). Но концы вискеров могут представлять несколько возможных альтернативных значений, среди них:

минимальное и максимальное из всех данных[1] (как на рисунке 2).

самая низкая точка отсчета все еще находится в пределах 1,5 IQR нижнего квартиля, а самая высокая точка отсчета все еще находится в пределах 1,5 IQR верхнего квартиля (часто называемого Tukey boxplot) (как на рисунке 3)

одно стандартное отклонение выше и ниже среднего значения данных 9-й процентиль и 91-й процентиль, 2-й процентиль и 98-й процентиль.

Любые данные, не включённые между усами, должны быть записаны как отклонение с точкой, маленьким кружком или звездой, но иногда это не делается.

Некоторые графовые графики содержат дополнительный символ для отображения среднего значения данных.

На некоторых квадратичных графиках на каждый виссер перед концом помещается перекрестный штрих.

Редко случается, что бокс-графики могут быть представлены вообще без усов.

В связи с такой изменчивостью, в подписи к графику уместно описать условные обозначения, применяемые для усов и отклонений.

Необычные процентили 2%, 9%, 91%, 98% иногда используются для вискерных поперечных люков и вискерных концов, чтобы показать сводку из семи чисел. Если данные распределены нормально, то места расположения семи меток на поле графика будут равномерно распределены.

Фундаментальный тип делянки, использующей контейнер для прохождения по межквартильному ходу, был представлен Мэри Элеонор Спир в 1952 году[6] и снова в 1969 году[7].

С тех пор как математик Джон У. Тьюки продвинул этот вид визуальной информации шоу в 1969 году, несколько незначительное отклонение от обычного плана коробки были изображены. Двумя наиболее широко известными из них являются диаграммы коробов переменной ширины и диаграммы коробов с оценками (см. рис. 4).

Диаграммы боксов переменной ширины очерчивают размер каждого бокса, информация о котором выводится на экран, делая ширину корпуса относительно размера бокса. Основное шоу состоит в том, чтобы сделать ширину контейнера относительно квадратного основания размера группы[1].

Графики ящиков для подсчета очков наносят “отступ” или сужение корпуса вокруг середины. Отступы помогают предложить неприятную инструкцию для недостоверности различения медиа; если отступы двух ящиков не покрывают, это доказывает измеримо критический контраст между медианами.[1] Ширина отступов соответствует межквартильному растяжению (IQR) примера и, наоборот, относительно квадратного основания размера примера. Как бы то ни было, существует уязвимость в отношении наиболее подходящего множителя (так как это может измениться в зависимости от сходства разностей в примерах

Одна из конвенций заключается в использовании

Участок контейнера позволяет оперативно графически оценить хотя бы один информационный показатель. Бокс-графики могут показаться более грубыми, чем гистограмма или измеритель толщины битов, однако они имеют несколько интересных моментов. Они занимают меньше места и особенно ценны для просмотра диссеменций между несколькими сборниками или наборами информации (см. модель на Рис. 1). Решение о количестве и ширине систем сосудов может сильно повлиять на наличие гистограммы, а решение о скорости передачи может сильно повлиять на наличие толщиномера.

Поскольку взгляд на измеряемую дисперсию более типичен, чем взгляд на участок контейнера, то контраст между графиком случая и вероятностной работой по толщине (гипотетической гистограммой) для обычного обращения N(0,σ2) может быть ценным инструментом для понимания графика случая (рис. 5).