L’écart type peut être une mesure du degré d’ouverture des chiffres.

Son symbole est σ (la lettre grecque sigma)

La formule est simple : c’est la racine de la variance. Vous vous demandez donc maintenant : “Qu’est-ce que c’est, la variance ?

Variance

L’écart est défini comme suit :

La moyenne des carrés des différences par rapport à la moyenne.

Pour calculer la variance, suivez ces étapes :

Calculer la moyenne (la moyenne simple des nombres)

Ensuite, pour chaque nombre : soustrayez la moyenne et mettez le résultat au carré (la différence au carré).

Ensuite, calculez la caractéristique de ces différences au carré. (Pourquoi le carré ?)

dogs on graph shoulder heights

Exemple

Vous et vos amis venez de mesurer la taille de vos chiens (en millimètres) :

Les hauteurs (aux épaules) sont : 600 mm, 470 mm, 170 mm, 430 mm et 300 mm.

Découvrez la moyenne, la variance, et donc la variance .

Votre initiative consiste à rechercher la moyenne:

dogs on graph: mean

Répondez :

Moyenne = 600 + 470 + 170 + 430 + 3005

= 19705

= 394

La hauteur moyenne (moyenne) est donc de 394 mm. Traçons cela sur le graphique :

Maintenant, nous calculons la différence de chaque chien par rapport à la moyenne:

dogs on graph: deviation

Pour calculer l’écart, prenez chaque différence, mettez-la au carré, puis faites la moyenne du résultat :

Variance

σ2 = 2062 + 762 + (−224)2 + 362 + (−94)25

= 42436 + 5776 + 50176 + 1296 + 88365

= 1085205

= 21704

L’écart est donc de 21 704

Et la variance est simplement la racine de la variance, donc :

Écart type

σ = √21704

= 147.32…

= 147 (au mm près)

dogs on graph: standard deviation

Et ce qui est bien avec l’écart de qualité, c’est qu’il est utile. Nous allons maintenant montrer quelles hauteurs se situent dans un écart (147 mm) de la moyenne :

Ainsi, en utilisant l’écart de qualité, nous avons un moyen “standard” de savoir ce qui est normal, et ce qui est de taille ou extra petit.

Les Rottweilers sont de grands chiens. Et les teckels sont un peu courts, non ?

En utilisant

distrubution normale 1 sd = 68%.

On peut s’attendre à ce qu’environ 68% des valeurs se situent dans un écart de plus ou moins 1 .

Pour en savoir plus, consultez la distribution gaussienne standard.

Essayez également le calculateur d’écart de qualité.

Mais … il y a un léger changement avec les données d’échantillon

Notre exemple a été pour une population (les 5 chiens sont les seuls qui nous intéressent).

Mais si l’information peut être un échantillon (une sélection prise dans une population beaucoup plus grande), alors le calcul change !

Lorsque vous avez “N” valeurs de données qui sont :

La population : divisée par N lors du calcul de la variance (comme nous l’avons fait)

Échantillon A : diviser par N-1 pour calculer la variance

Tous les autres calculs restent équivalents, y compris la manière dont nous avons calculé la moyenne.

Exemple : si nos 5 chiens ne sont qu’un échantillon d’une population de chiens beaucoup plus importante, nous divisons par 4 au lieu de 5 comme ceci :

Variance de l’échantillon = 108 520 / 4 = 27 130

Variance de l’échantillon = √27,130 = 165 (au mm près)

Considérez cela comme une “correction” lorsque vos données ne sont qu’un échantillon.

Formules

Voici les 2 formules, expliquées à variantes Formules si vous souhaitez comprendre davantage :

L'”écart type de population” :

square root of [ (1/N) times Sigma i=1 to N of (xi - mu)^2 ]

square root of [ (1/(N-1)) times Sigma i=1 to N of (xi - xbar)^2 ]

L'”écart type de l’échantillon” : Cela semble compliqué, mais le changement important consiste à

diviser par N-1 (au lieu de N) lors du calcul d’une variance d’échantillon.