Statystycy używają miar podsumowujących, aby opisać wielkość zmienności lub rozpiętości w zbiorze danych. Najczęściej stosowanymi miarami zmienności są: zakres, zakres międzykwartylowy (IQR), wariancja i odchylenie standardowe.

Zakres

Zakres jest rozróżnieniem pomiędzy największymi i najmniejszymi cechami w wielu cechach.

Pomyśl na przykład o towarzyszących im liczbach: 1, 3, 4, 5, 5, 6, 7, 11. Dla tego układu liczb, zakres wynosiłby 11 – 1 lub 10.

Zakres międzykwartylowy (IQR)

IQR (interquartile go) jest proporcją zmienności, w świetle rozdzielenia indeksu informacyjnego na kwartyle.

Kwartyle dzielą wymagany indeks informacyjny na cztery równoważne części. Właściwości, które rozdzielają każdą część są znane jako główny, drugi i trzeci kwartyl; i są one oznaczone przez Q1, Q2 i Q3, indywidualnie.

Q1 jest “średnią” wartością w pierwszej połowie zamówionego zestawu danych.

Q2 jest wartością środkową w zbiorze.

Q3 jest “średnią” wartością w drugiej połowie zamówionego zestawu danych.

Zakres międzykwartylowy jest równoważny Q3 minus Q1. Pomyślmy na przykład o liczbach towarzyszących: 1, 2, 3, 4, 5, 6, 7, 8

Eight numbers: 1, 2, 3, 4, 5, 6, 7, 8

Q2 jest środkiem całego indeksu informacyjnego – wartością środkową. W tym modelu mamy parzystą liczbę punktów danych, więc środek jest równy normalnemu środkowi dwóch wartości środkowych. W ten sposób Q2 = (4 + 5)/2 lub Q2 = 4,5. Q1 jest środkiem zachęty w głównej części indeksu informacyjnego. Q1 jest wartością środkową w pierwszej połowie zbioru danych. Ponieważ w pierwszej połowie zbioru danych znajduje się parzysta liczba punktów danych, wartość środkowa jest średnią z dwóch wartości środkowych, to znaczy Q1 = (2 + 3)/2 lub Q1 = 2,5. Q3 jest środkiem zachęty w drugim 50% zestawu danych. Ponownie, ponieważ drugie 50% zbioru informacji ma dużą liczbę postrzegań, wartość środkowa jest normalną z dwóch wartości środkowych; to jest Q3 = (6 + 7)/2 lub Q3 = 6,5. Zakres międzykwartylowy to Q3 mniej Q1, więc IQR = 6,5 – 2,5 = 4.

Zauważ, że procedura ta podzieliła indeks informacyjny na cztery części o równoważnej wielkości. Segment początkowy składa się z 1 i 2, kolejny z 3 i 4, trzeci z 5 i 6 oraz czwarty z 7 i 8.

Wariant

W danej populacji odchylenie to jest normalnym kwadratowym odchyleniem od średniej dla danej populacji, zgodnie z towarzyszącym mu przepisem:

σ2 = Σ ( Xi – μ )2/N

gdzie σ2 jest wariancją populacji, μ jest średnią populacji, Xi jest i-tym składnikiem populacji, a N jest liczbą składników w populacji.

Percepcja z podstawowego, arbitralnego przykładu może być użyta do oceny różnicy w populacji. Z tego powodu, przykładowa wariancja charakteryzuje się nieco unikalną formułą i używa nieco innej notacji:

s2 = Σ ( xi – x )2/( n – 1 )

gdzie s2 to zmiana przykładu, x to średnia przykładu, xi to i-ty komponent z przykładu, a n to liczba komponentów w przykładzie. Używając tego wzoru, przykładowa różnica może być postrzegana jako bezstronny miernik rzeczywistych wahań populacji. Wzdłuż tych linii, w świetle informacji z prostego, nieregularnego przykładu, jest to przepis do wykorzystania.

Odchylenie standardowe

Odchylenie standardowe jest kwadratową podstawą zmiany. Wzdłuż tych linii, odchylenie standardowe populacji jest:

σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]

gdzie σ to odchylenie standardowe populacji, μ to średnia populacji, Xi to i-ty składnik populacji, a N to liczba składników w populacji.

Analitycy często używają podstawowych nieregularnych przykładów do określenia odchylenia standardowego populacji, w świetle informacji z badań. Biorąc pod uwagę prosty, arbitralny przykład, najlepszą miarą odchylenia standardowego populacji jest:

s = sqrt [ s2 ] = sqrt [ Σ ( xi – x )2/( n – 1 ) ]

gdzie s jest przykładowym odchyleniem standardowym, x jest średnią z przykładu, xi jest i-tym komponentem z przykładu, a n jest liczbą komponentów w przykładzie.

Wpływ zmiany jednostek

Raz na jakiś czas specjaliści zmieniają jednostki (od minut do godzin, od stóp do metrów, i tak dalej). Oto, w jaki sposób zmieniając jednostki, wpływa się na mierniki zmienności.

Przy braku możliwości dodania do każdego szacunku stałej wartości, separacja między cechami nie ulega zmianie. W rezultacie, wszystkie miary zmienności (zakres, zakres międzykwartylowy, odchylenie standardowe i wariancja) pozostają takie same.

Następnie, jeszcze raz, załóżmy, że każda z nich zwiększa zachętę o stałą. Ma to wpływ na zwiększenie zakresu, międzykwartylowego go (IQR) i odchylenia standardowego o tę spójność. Ma to o wiele większy wpływ na zmianę. Zwiększa to różnicę o kwadrat spójnego.