График ящиков или ящиков, а также график вискеров помогут вам отобразить распределение базы данных в виде сводки из пяти чисел. Первый квартиль Q1 будет минимальным, третий квартиль Q3 – медианным, пятый квартиль Q5 – максимальным. Вы можете узнать пропуски и их значения, используя график ящиков. Вы также можете понять, симметричны ли Ваши данные, плотно ли они или несимметричны, в группе или у Вас есть перекошенные данные.
Что такое диаграмма боксов?
График боксов и боксов включает в себя линии и боксы для разделения данных на различные числовые группы. 50% центральных данных будет приходиться на центральную линию ящика. Это значение является медианой. Строки будут захватывать оставшиеся данные, простираясь от каждого ящика. Пунктирные линии, которые вы разместите вокруг краев линии, будут представлять собой отклонения.
Некоторые важные термины, которые вам следует знать:
– Минимальный балл
Минимальный балл – наименьший и не включает в себя исключения. Этот столбец находится в конце левого уса.
– Нижний квартиль
В нижнем квартиле вы найдете двадцать пять процентов баллов. Это первый квартиль.
– Медиан
Медиана – это средняя точка данных. Вы будете представлять ее линией, делящей ящик на две половины. Вы также можете назвать это вторым квартилем. Половина баллов меньше медианы, а половина больше или равна.
– Верхний квартил
Ниже значения верхнего или третьего квартиля находится семьдесят пять процентов данных. Остальные данные, т.е. 25% данных, останутся выше значения.
– Максимальная оценка
Вы найдете более высокий балл в конце правого уса. Этот раздел не исключает исключений.
– Усы
Верхние 25% и нижние 25% будут представлять собой баллы за пределами центра 50%.
– Межквартирный диапазон (или IQR)
В интерквортийном диапазоне сюжета коробки будут показаны средние 50%. Этот средний диапазон включает в себя данные от 25 до 75 процентов.
Пример коробчатого графика: Поиск сводки из пяти чисел
Вот веса образца коробки изюма 101010. Единичная мера будет в граммах. Вам нужно найти сводку этих коробок с изюмом, состоящую из пяти чисел.
303030, 292929, 373737, 353535, 383838, 373737, 353535, 282828, 252525, 343434
Сделайте блок-слот данных
Шаг 1
Упорядочить все точки данных, начиная с самых маленьких и заканчивая самыми большими. Таким образом, мы можем начать с упорядочения данных:
252525, 282828, 292929, 303030, 343434, 353535, 353535, 373737, 373737, 383838
Шаг 2
Теперь тебе нужно найти медиану. Проще говоря, медиана – это средние два числа. Итак, наша медиана в этих данных будет:
252525, 282828, 292929, 303030, “большой (34)3434”, “большой (35)3535”, 353535, 373737, 373737, 383838…
\dfrac(30+34)(2)
=32+34 / 2 =32
Это значит, что медиана будет 323232.
Шаг 3
Тебе нужно найти квартиль. Первым квартилем вы будете считать медиану точек данных. Вы начнете слева от медианы.
252525, 282828, \large(29)2929, 303030
Q_1 = 29
1 КВАРТАЛ = 29 КВАРТАЛ
Стартовый абонемент – 1, а конечный абонемент – 29.
Медианой точки данных является третий квартиль, а позиция будет находиться справа от медианы.
343434, 353535, 353535, \large(37)3737, 373737, 383838.
Q_3=37
Q3=37Q
Стартовый абонемент – три, а конечный абонемент – 37.
Шаг 4
Теперь заполните пятичисловую сводку и найдите максимальное и минимальное значение поля.
Минимальным значением будет наименьшая точка данных. В приведенном выше примере диаграммы ящика это значение будет 252525.
Самой большой точкой данных будет максимальное значение. На приведенном выше графике поля это значение будет 383838.
Следовательно, сводка из пяти чисел:
252525, 292929, 323232, 373737, 383838
Сравнение “Ящика” и “Усатого участка”.
График ящиков и усов позволяет визуализировать различия между различными группами и образцами. Сравнивая график ящиков и усов, можно получить существенную статистическую информацию, например, о пробелах, диапазонах и медианах.
Шаг 1: Сравнение медиа
Вам нужно сравнить медиков отдельных коробок. Если медиана не находится внутри коробки, то две группы отличаются друг от друга.
Шаг 2: Сравнение Усатого и Межквартильного диапазонов участков ячейки
Необходимо сравнить длины коробок межквартильных диапазонов. Таким образом, Вы сможете проанализировать данные и то, как они распределяются между образцами. Рассеивание данных зависит от длины ящика. С другой стороны, дисперсия будет ограничена небольшим количеством данных.
Необходимо проверить общее распределение между двумя вибраторами, так как оно указывает на экстремальные значения. Кроме того, он будет показывать диапазон значений, что является другим типом дисперсии. Когда диапазоны обширны, вы обнаружите более широкое распространение. Это еще больше рассеивает данные.
Шаг 3: Поиск потенциальных выбросов
При выполнении просмотра бокс-графиков в качестве точки данных учитывается выброс. Местоположение этой точки данных будет располагаться за пределами усы.
Шаг 4: Поиск признаков перекоса
Теперь нужно искать внешний вид данных. Проверьте, симметричен он или нет. Просмотрите каждый образец и найдите одинаковую асимметрию.
Заключение
С помощью бо-эксплота вы можете показать на графике сводку из пяти чисел. Основное назначение графика – показать среднюю часть данных. Эта средняя часть является межквартильным диапазоном. Первый квартил находится в конце поля на отметке 25%, а третий – на отметке 75%.
Вы добавите минимум в пять левых областей графика. Это появляется в конце слева. Минимум – наименьшее число, а максимум, находящийся в крайнем правом углу, – наибольшее число. В центре поля вы найдете медиану. Чтобы найти медиану, нужно посмотреть на вертикальную полосу. В реальной жизни вы не будете много использовать коробку и сюжет с усами. Тем не менее, вы можете использовать инструмент, чтобы найти краткое обобщение данных.