Qu’est-ce que la règle empirique ?
Cette règle en statistique suggère que toutes les données que vous pouvez observer seront comprises dans trois écarts types différents de la moyenne dans une distribution normale. Vous connaissez peut-être aussi la règle empirique sous le nom de règle 68-95-99.7 ou règle des trois signes. Selon cette règle, 68 % des données se situent dans le premier écart-type, 95 % dans le premier et le deuxième écart-type et 99,7 % dans les trois écart-types :
68% – (µ ± σ),
95% – (µ ± 2σ)
99,7% – (µ ± 3σ)
Si nous avons une distribution normale des données sur un graphique sur l’axe des x, la courbe en cloche sera au centre. Le premier écart-type comprend la moitié positive (µ + σ) et la moitié négative (µ – σ). Ces deux moitiés du premier écart-type seront collectivement de 68%, mais si nous ne considérons que la moitié positive, elle serait de 34%, et la moitié négative serait la même. De même, si nous considérons le second écart-type, nous pouvons additionner la moitié positive du premier et du second écart-type avec le côté négatif des deux écarts, ce qui donne un résultat complet à 95 %. Les phénomènes seront les mêmes dans le troisième écart également.
Distribution normale
Il s’agit probablement d’une distribution essentielle des probabilités dans les statistiques. Par exemple, des ensembles de données comme la fréquence cardiaque, la pression artérielle, la taille et les scores de QI formeront une courbe en cloche de distribution normale
La symétrie de la distribution normale
La distribution normale est celle des variables continues. Les variables continues ont des valeurs infinies. Elles incluent ces valeurs dans la distribution. Une distribution normale aide à décrire la manière dont vous distribuez les variables. La plupart des variables, données ou observations se regroupent au centre dans une distribution normale, ce qui provoque un pic. C’est pourquoi la plupart des distributions normales ont une forme de cloche.
De plus, dans une distribution normale, la moyenne, la médiane et le mode sont égaux. Il y a une courbe au centre, qui est la moyenne. Cependant, les valeurs de gauche et de droite sont égales. Vous pouvez définir la distribution normale par la moyenne et l’écart-type. Ce sont les deux facteurs essentiels qui affectent la courbe. 68 % de la surface est couverte par un seul écart-type de la moyenne.
Paramètres de la distribution normale
Moyenne
Nous pouvons trouver la moyenne de l’ensemble des données en additionnant toutes les valeurs et en divisant le total par le nombre de valeurs.
Médiane
Lorsque vous ordonnez l’ensemble de données du plus petit au plus grand, la valeur moyenne est la médiane.
Mode
Le mode est cette valeur qui apparaît très souvent dans l’ensemble des données.
Écart-type
L’écart-type mesure l’étendue des valeurs des données. Le symbole de l’écart-type est sigma. L’écart-type n’est que la racine carrée des variances. Par exemple, lorsque vous mesurez le taux annuel de rendement de l’investissement, vous pouvez trouver la volatilité historique de l’investissement. Cette approche est une mesure statistique ou un écart-type.
Écarts
Les écarts mesurent également la diffusion des valeurs. Toutefois, ce terme fait référence à la distance entre les chiffres de l’ensemble de données et la moyenne et les autres chiffres
Z-Scores
Le Z-score est une représentation numérique de la relation entre la moyenne d’un groupe et la valeur. Vous pouvez calculer le Z-score en tant qu’écart type à l’aide de la moyenne. Lorsque le Z-score est égal à zéro, le score moyen et le score des données sont égaux. Le score Z peut être négatif et positif. Si le score Z est négatif, il est inférieur à la moyenne, et si le score Z est supérieur à la moyenne, il est positif.
Comprendre le concept de la règle 68-95-99.7
La distribution normale des données se rapporte généralement à la règle 68-95-99.7. Vous pouvez trouver 68% des données dans le premier écart-type, 95% des données dans le deuxième écart-type et 99,7% des données dans le troisième écart-type de la moyenne.
Fonction de densité de probabilité
Pour connaître le pourcentage, vous devez savoir ce que signifie la fonction de densité de probabilité ou PDF. À l’aide de la PDF, vous pouvez spécifier la probabilité d’une variable aléatoire qui se situe dans une plage de valeurs spécifique au lieu de prendre une valeur différente. Vous pouvez calculer la probabilité en retirant l’intégrale de la PDF de la variable sur l’intervalle. Cela signifie que la zone se trouve dans la fonction de densité mais entre les valeurs les plus élevées et les plus faibles et sur l’axe horizontal de la plage.
Dans le premier écart-type, il y a 68% des données. Donc, si vous voulez trouver la probabilité d’atterrissage du point de données aléatoire dans le premier écart type, vous devez calculer la moyenne des données de -1 à 1 écart type.
Dans le deuxième écart-type, il y a 95% des données. Donc si vous voulez trouver la probabilité d’atterrissage d’un point de données aléatoire dans le second écart-type, vous devez calculer la moyenne des données de -2 à 2 écart-types.
Le troisième écart-type contient 99,7 % des données. Donc si vous voulez trouver la probabilité d’atterrissage d’un point de données aléatoire dans le troisième écart-type, vous devez calculer la moyenne des données de -3 à 3 écart-types.
Conclusion
Nous pouvons obtenir rapidement une estimation approximative de la probabilité des données grâce à la règle 68-95-99.7. Vous pouvez utiliser cette méthode comme un simple test lorsque la population des données est normale. Toutefois, si la population des données n’est pas normale, vous pouvez utiliser cette méthode comme un test de normalité.