Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Статистики используют суммарные показатели для описания степени изменчивости или разброса в наборе данных. Наиболее распространенными показателями изменчивости являются диапазон, межквартильный диапазон (IQR), дисперсия и стандартное отклонение.

Диапазон

Ассортимент – это различие между самыми большими и самыми маленькими качествами во многих качествах.

Например, подумайте о сопроводительных цифрах: 1, 3, 4, 5, 5, 6, 7, 11. При таком расположении чисел диапазон будет 11 – 1 или 10.

Межквартильный диапазон (IQR).

Межквартильник go (IQR) – это доля изменчивости, в свете разделения информационного индекса на квартиль.

Квортиль разделяет позицию запрашиваемого информационного показателя на четыре эквивалентные части. Качества, которые разделяют каждую часть, называются главным, вторым и третьим квартилями; они обозначаются Q1, Q2, и Q3, индивидуально…

Q1 – это “среднее” значение в первой половине рангового набора данных.

Q2 – медианное значение в наборе.

Q3 – это “среднее” значение во второй половине рангового набора данных.

Межквартильный диапазон эквивалентен Q3 минус Q1. Например, подумайте о сопроводительных номерах: 1, 2, 3, 4, 5, 6, 7, 8

Eight numbers: 1, 2, 3, 4, 5, 6, 7, 8

Q2 – середина всего информационного показателя – среднее значение. В этой модели мы имеем четное количество точек данных, поэтому середина эквивалентна нормали двух центральных качеств. Таким образом, Q2 = (4 + 5)/2 или Q2 = 4,5. Q1 является центром стимула в основной части информационного показателя. Q1 – среднее значение в первой половине массива данных. Так как в первой половине массива данных существует четное количество точек данных, то среднее значение является средним из двух средних значений, т.е. Q1 = (2 + 3)/2 или Q1 = 2,5. Q3 является центром стимула во второй половине набора данных. Еще раз повторюсь, поскольку вторые 50% сбора информации имеют большое количество восприятий, центр является нормальным для двух центральных качеств, т.е. Q3 = (6 + 7)/2 или Q3 = 6,5. Межквартильный диапазон равен Q3 минус Q1, поэтому IQR = 6,5 – 2,5 = 4.

Обратите внимание, что эта процедура разбила информационный индекс на четыре части эквивалентного размера. Начальный отрезок состоит из 1 и 2; последующий отрезок – 3 и 4; третий отрезок – 5 и 6; четвертый отрезок – 7 и 8.

Вариант

У населения дисперсия представляет собой нормальное квадратное отклонение от среднестатистического значения, характеризующееся сопровождающей рецептурой:

σ2 = Σ ( Xi – μ )2/N

где σ2 – это дисперсия населения, μ – среднее число населения, Xi – его компонент из населения, а N – число компонентов в населении.

Восприятия из основного произвольного примера могут быть использованы для оценки разницы населения. По этой причине дисперсия выборки характеризуется несколько уникальной формулой и использует несколько другую нотацию:

s2 = Σ ( xi – x )2/( n – 1 )

где s2 – изменение примера, x – среднее значение примера, xi – ith компонента из примера, а n – количество компонентов в примере. Используя эту формулу, разницу в примере можно рассматривать как беспристрастный показатель истинных колебаний численности населения. В соответствии с этим, на случай, что вы должны оценить неясную разницу населения, в свете информации из простого нерегулярного примера, это рецепт, чтобы использовать.

Стандартное отклонение

Стандартное отклонение является квадратным основанием изменения. В соответствии с этим, среднеквадратическое отклонение населения является:

σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]

где σ – стандартное отклонение населения, μ – среднее значение населения, Xi – его компонент от населения, а N – количество компонентов в населении.

Аналитики часто используют основные нерегулярные примеры для измерения стандартного отклонения населения в свете тестовых данных. В случае простого произвольного примера лучшим показателем стандартного отклонения населения является стандартное отклонение:

s = кв.м. [ s2 ] = кв.м. [ Σ ( xi – x )2/( n – 1 ) ]

где s – пример стандартного отклонения, x – среднее значение примера, xi – его составляющая из примера, а n – количество составляющих в примере.

Влияние изменения единиц измерения

Время от времени специалисты меняют подразделения (от минут до часов, от футов до метров и т.д.). Вот как влияют на показатели изменчивости, когда мы меняем подразделения.

На случай, если к каждому уважению добавляется устойчивая величина, разделение качеств не меняется. В результате все меры изменчивости (диапазон, межквартильный диапазон, стандартное отклонение и дисперсия) остаются неизменными.

Опять же, предположим, что вы увеличиваете каждый стимул последовательным. Это влияет на увеличение диапазона, межквартильного хода (IQR), и стандартного отклонения на это последовательное. Это оказывает гораздо более заметное влияние на изменение. Оно увеличивает разницу на квадрат константы.

Языки

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.