Les statisticiens utilisent des mesures sommaires pour décrire le degré de variabilité ou de dispersion d’un ensemble de données. Les mesures les plus courantes de la variabilité sont l’étendue, l’écart interquartile (IQR), la variance et l’écart-type.
La fourchette
La gamme est la distinction entre les plus grandes et les plus petites qualités dans beaucoup de qualités.
Pensez par exemple aux chiffres qui accompagnent la gamme : 1, 3, 4, 5, 5, 6, 7, 11. Pour cette disposition des nombres, la fourchette serait de 11 – 1 ou 10.
L’intervalle interquartile (IQR)
Le go interquartile (IQR) est une proportion de la variabilité, à la lumière de la séparation d’un indice informationnel en quartiles.
Les quartiles séparent l’indice informationnel d’une demande de poste en quatre parties équivalentes. Les qualités qui séparent chaque partie sont connues sous le nom de quartiles principal, deuxième et troisième ; et elles sont indiquées par Q1, Q2 et Q3, individuellement..
Q1 est la valeur “moyenne” dans la première moitié de la série de données ordonnées par rang.
Q2 est la valeur médiane dans l’ensemble.
Q3 est la valeur “moyenne” dans la deuxième moitié de l’ensemble des données classées.
L’intervalle interquartile est équivalent à Q3 moins Q1. Pensez par exemple aux chiffres qui accompagnent cette valeur : 1, 2, 3, 4, 5, 6, 7, 8
Q2 est le milieu de tout l’indice informationnel – la valeur moyenne. Dans ce modèle, nous avons un nombre pair de points de données, donc le milieu est équivalent à la normale des deux qualités centrales. De cette façon, Q2 = (4 + 5)/2 ou Q2 = 4,5. Q1 est le centre d’une incitation dans la partie principale de l’indice informationnel. Q1 est la valeur centrale dans la première moitié de l’ensemble de données. Comme il y a un nombre pair de points de données dans la première moitié de l’ensemble de données, la valeur médiane est la moyenne des deux valeurs médianes, c’est-à-dire Q1 = (2 + 3)/2 ou Q1 = 2,5. Q3 est le centre d’une incitation dans la deuxième moitié de l’ensemble de données. Une fois de plus, comme le second 50 % de la collecte d’informations comporte un grand nombre de perceptions, la valeur centrale est la normale des deux qualités centrales ; c’est-à-dire Q3 = (6 + 7)/2 ou Q3 = 6,5. L’intervalle interquartile est Q3 moins Q1, donc IQR = 6,5 – 2,5 = 4.
Il est à noter que cette procédure a permis de diviser l’indice informationnel en quatre parties de taille équivalente. Le segment initial comprend 1 et 2 ; la section suivante, 3 et 4 ; la troisième section, 5 et 6 ; et la quatrième section, 7 et 8.
L’écart
Dans une population, la variance est l’écart quadratique normal par rapport à la moyenne de la population, telle que caractérisée par la recette qui l’accompagne :
σ2 = Σ ( Xi – μ )2/N
où σ2 est la variance de la population, μ est la moyenne de la population, Xi est la ième composante de la population, et N est le nombre de composantes de la population.
Les perceptions d’un exemple arbitraire de base peuvent être utilisées pour évaluer la différence d’une population. Pour cette raison, la variance de l’échantillon est caractérisée par une formule quelque peu unique et utilise une notation légèrement différente :
s2 = Σ ( xi – x )2/( n – 1 )
où s2 est la variation de l’exemple, x est la moyenne de l’exemple, xi est la ième composante de l’exemple, et n est le nombre de composantes de l’exemple. En utilisant cette formule, la différence de l’exemple peut être considérée comme un indicateur impartial de la fluctuation réelle de la population. Dans cet ordre d’idées, si vous devez évaluer une obscure différence de population à la lumière d’informations provenant d’un exemple irrégulier, voici la recette à utiliser.
L’écart type
L’écart-type est la base carrée du changement. Dans cette optique, l’écart-type d’une population est
σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]
où σ est l’écart-type de la population, μ est la moyenne de la population, Xi est la ième composante de la population, et N est le nombre de composantes de la population.
Les analystes utilisent fréquemment des exemples de base irréguliers pour évaluer l’écart type d’une population, à la lumière des informations de test. Si l’on donne un exemple arbitraire simple, la meilleure façon d’évaluer l’écart type d’une population est de le faire :
s = sqrt [ s2 ] = sqrt [ Σ ( xi – x )2/( n – 1 ) ]
où s est l’écart-type de l’exemple, x est la moyenne de l’exemple, xi est la ième composante de l’exemple et n est le nombre de composantes de l’exemple.
Impact du changement d’unités
De temps en temps, les spécialistes changent d’unité (de minutes à heures, de pieds à mètres, etc.). ). Voici comment les mesures de la variabilité sont affectées lorsque nous changeons d’unité.
Au cas où vous ajouteriez une constante à chaque estime, la séparation entre les qualités ne changerait pas. Par conséquent, toutes les mesures de la variabilité (étendue, écart interquartile, écart-type et variance) restent les mêmes.
Encore une fois, supposons que vous augmentiez chacune des motivations par une constante. Cela a pour effet d’augmenter l’intervalle, le go interquartile (IQR) et l’écart-type de cette constante. Cela a un impact beaucoup plus important sur le changement. Elle augmente la différence du carré de la constante.