Статистики используют суммарные показатели для описания степени изменчивости или разброса в наборе данных. Наиболее распространенными показателями изменчивости являются диапазон, межквартильный диапазон (IQR), дисперсия и стандартное отклонение.
Диапазон
Ассортимент – это различие между самыми большими и самыми маленькими качествами во многих качествах.
Например, подумайте о сопроводительных цифрах: 1, 3, 4, 5, 5, 6, 7, 11. При таком расположении чисел диапазон будет 11 – 1 или 10.
Межквартильный диапазон (IQR).
Межквартильник go (IQR) – это доля изменчивости, в свете разделения информационного индекса на квартиль.
Квортиль разделяет позицию запрашиваемого информационного показателя на четыре эквивалентные части. Качества, которые разделяют каждую часть, называются главным, вторым и третьим квартилями; они обозначаются Q1, Q2, и Q3, индивидуально…
Q1 – это “среднее” значение в первой половине рангового набора данных.
Q2 – медианное значение в наборе.
Q3 – это “среднее” значение во второй половине рангового набора данных.
Межквартильный диапазон эквивалентен Q3 минус Q1. Например, подумайте о сопроводительных номерах: 1, 2, 3, 4, 5, 6, 7, 8
Q2 – середина всего информационного показателя – среднее значение. В этой модели мы имеем четное количество точек данных, поэтому середина эквивалентна нормали двух центральных качеств. Таким образом, Q2 = (4 + 5)/2 или Q2 = 4,5. Q1 является центром стимула в основной части информационного показателя. Q1 – среднее значение в первой половине массива данных. Так как в первой половине массива данных существует четное количество точек данных, то среднее значение является средним из двух средних значений, т.е. Q1 = (2 + 3)/2 или Q1 = 2,5. Q3 является центром стимула во второй половине набора данных. Еще раз повторюсь, поскольку вторые 50% сбора информации имеют большое количество восприятий, центр является нормальным для двух центральных качеств, т.е. Q3 = (6 + 7)/2 или Q3 = 6,5. Межквартильный диапазон равен Q3 минус Q1, поэтому IQR = 6,5 – 2,5 = 4.
Обратите внимание, что эта процедура разбила информационный индекс на четыре части эквивалентного размера. Начальный отрезок состоит из 1 и 2; последующий отрезок – 3 и 4; третий отрезок – 5 и 6; четвертый отрезок – 7 и 8.
Вариант
У населения дисперсия представляет собой нормальное квадратное отклонение от среднестатистического значения, характеризующееся сопровождающей рецептурой:
σ2 = Σ ( Xi – μ )2/N
где σ2 – это дисперсия населения, μ – среднее число населения, Xi – его компонент из населения, а N – число компонентов в населении.
Восприятия из основного произвольного примера могут быть использованы для оценки разницы населения. По этой причине дисперсия выборки характеризуется несколько уникальной формулой и использует несколько другую нотацию:
s2 = Σ ( xi – x )2/( n – 1 )
где s2 – изменение примера, x – среднее значение примера, xi – ith компонента из примера, а n – количество компонентов в примере. Используя эту формулу, разницу в примере можно рассматривать как беспристрастный показатель истинных колебаний численности населения. В соответствии с этим, на случай, что вы должны оценить неясную разницу населения, в свете информации из простого нерегулярного примера, это рецепт, чтобы использовать.
Стандартное отклонение
Стандартное отклонение является квадратным основанием изменения. В соответствии с этим, среднеквадратическое отклонение населения является:
σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]
где σ – стандартное отклонение населения, μ – среднее значение населения, Xi – его компонент от населения, а N – количество компонентов в населении.
Аналитики часто используют основные нерегулярные примеры для измерения стандартного отклонения населения в свете тестовых данных. В случае простого произвольного примера лучшим показателем стандартного отклонения населения является стандартное отклонение:
s = кв.м. [ s2 ] = кв.м. [ Σ ( xi – x )2/( n – 1 ) ]
где s – пример стандартного отклонения, x – среднее значение примера, xi – его составляющая из примера, а n – количество составляющих в примере.
Влияние изменения единиц измерения
Время от времени специалисты меняют подразделения (от минут до часов, от футов до метров и т.д.). Вот как влияют на показатели изменчивости, когда мы меняем подразделения.
На случай, если к каждому уважению добавляется устойчивая величина, разделение качеств не меняется. В результате все меры изменчивости (диапазон, межквартильный диапазон, стандартное отклонение и дисперсия) остаются неизменными.
Опять же, предположим, что вы увеличиваете каждый стимул последовательным. Это влияет на увеличение диапазона, межквартильного хода (IQR), и стандартного отклонения на это последовательное. Это оказывает гораздо более заметное влияние на изменение. Оно увеличивает разницу на квадрат константы.