Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Statistici gebruiken samenvattende maatregelen om de mate van variabiliteit of spreiding in een reeks gegevens te beschrijven. De meest voorkomende maten voor variabiliteit zijn het bereik, het interkwartielbereik (IQR), de variantie en de standaardafwijking.

De reeks

Het assortiment is het onderscheid tussen de grootste en de kleinste kwaliteiten in een groot aantal kwaliteiten.

Denk bijvoorbeeld aan de bijbehorende cijfers: 1, 3, 4, 5, 5, 6, 7, 11. Voor deze indeling van getallen zou het bereik 11 – 1 of 10 zijn.

Het interkwartielbereik (IQR)

Het interkwartiel go (IQR) is een deel van de veranderlijkheid, in het licht van het scheiden van een informatieve index in kwartielen.

Kwartielen scheiden een gevraagde positie in vier equivalente delen. De kwaliteiten die elk deel hiaat vertonen staan bekend als de belangrijkste, tweede en derde kwartielen; en ze worden aangeduid met Q1, Q2 en Q3, afzonderlijk.

Q1 is de “middelste” waarde in de eerste helft van de gerangschikte dataset.

Q2 is de mediaanwaarde in de set.

Q3 is de “middelste” waarde in de tweede helft van de gerangschikte dataset.

Het interkwartielbereik is gelijk aan Q3 minus Q1. Denk bijvoorbeeld aan de bijbehorende getallen: 1, 2, 3, 4, 5, 6, 7, 8

Q2 is het midden van de hele informatie-index – de middenwaarde. In dit model hebben we een even aantal datapunten, dus het midden is gelijk aan de normale waarde van de twee centrumkwaliteiten. Op deze manier is Q2 = (4 + 5)/2 of Q2 = 4,5. Q1 is het centrum van een stimulans in het hoofdgedeelte van de informatie-index. Q1 is de middenwaarde in de eerste helft van de dataset. Aangezien er een even aantal gegevenspunten in de eerste helft van de gegevensreeks is, is de middenwaarde het gemiddelde van de twee middenwaarden; dat wil zeggen, Q1 = (2 + 3)/2 of Q1 = 2,5. Q3 is het centrum van een stimulans in de tweede helft van de dataset. Nogmaals, aangezien de tweede 50% van de informatieverzameling een groot aantal waarnemingen heeft, is het centrum de normale waarde van de twee middenwaarden; dat wil zeggen, Q3 = (6 + 7)/2 of Q3 = 6,5. Het interkwartielbereik is Q3 minus Q1, dus IQR = 6,5 – 2,5 = 4.

Merk op dat deze procedure de informatieve index heeft opgedeeld in vier stukken van gelijke grootte. Het eerste segment bestaat uit 1 en 2; het daaropvolgende deel, 3 en 4; het derde deel, 5 en 6; en het vierde deel, 7 en 8.

De Variant

In een populatie is de variantie de normale kwadratische afwijking van het populatiegemiddelde, zoals die wordt gekenmerkt door het bijbehorende recept:

σ2 = Σ ( Xi – μ )2/N

waarbij σ2 de populatievariantie is, μ het populatiegemiddelde, Xi de i-de component uit de populatie, en N het aantal componenten in de populatie.

Percepties van een willekeurig basisvoorbeeld kunnen worden gebruikt om het verschil van een populatie te beoordelen. Om deze reden wordt de steekproefvariantie gekenmerkt door een ietwat unieke formule, en wordt er een iets andere notatie gebruikt:

s2 = Σ ( xi – x )2/( n – 1 )

waarbij s2 de voorbeeldwissel is, x het voorbeeldgemiddelde, xi de ide component uit het voorbeeld en n het aantal componenten in het voorbeeld. Met behulp van deze formule kan het voorbeeldverschil worden gezien als een onpartijdige maatstaf voor de echte populatiefluctuatie. Op deze manier is de kans groot dat je een duister populatieverschil moet inschatten, in het licht van informatie uit een eenvoudig, onregelmatig voorbeeld is dit het recept om te gebruiken.

De standaardafwijking

De standaardafwijking is de vierkante basis van de verandering. Volgens deze lijnen is de standaardafwijking van een populatie:

σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ].

waarbij σ de standaardafwijking van de populatie is, μ het gemiddelde van de populatie, Xi de i-de component van de populatie en N het aantal componenten in de populatie.

Analisten maken vaak gebruik van onregelmatige basisvoorbeelden om de standaardafwijking van een populatie te meten, in het licht van testinformatie. Een eenvoudig willekeurig voorbeeld is de beste maatstaf voor de standaardafwijking van een populatie:

s = sqrt [ s2 ] = sqrt [ Σ ( xi – x )2/( n – 1 ) ].

waarbij s de voorbeeldstandaardafwijking is, x het voorbeeldgemiddelde, xi de i-de component van het voorbeeld en n het aantal componenten in het voorbeeld.

Gevolgen van het veranderen van eenheden

Af en toe wisselen specialisten van eenheid (minuten tot uren, voeten tot meters, enz.). Hier is hoe variabiliteitsmetingen worden beïnvloed als we van eenheid wisselen.

De kans dat je aan elke waardering een vaste waarde toevoegt, verandert niets aan de scheiding tussen de kwaliteiten. Als gevolg daarvan blijven alle maten van variabiliteit (bereik, interkwartielbereik, standaardafwijking en variantie) gelijk.

Dan weer, stel dat je elk een stimulans verhoogt met een consistente. Dit heeft het effect van het verhogen van het bereik, interkwartiel go (IQR), en standaardafwijking door die consistente. Het heeft een veel prominentere invloed op de verandering. Het verhoogt het verschil met het kwadraat van de consistente.

Talen

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.