Une exception est un peu d’information qui est un bon moyen irrégulier de différents centres d’intérêt. En fin de compte, il s’agit d’informations qui se situent en dehors des différentes qualités de l’ensemble. Si par hasard vous aviez Pinocchio dans une classe d’enfants, la longueur de son nez contrastant avec celui de différents enfants serait une exception.

Dans cette disposition de numéros irréguliers, 1 et 201 sont des anomalies :

1, 99, 100, 101, 103, 109, 110, 201

“1” est une valeur incroyablement faible et “201” une valeur très élevée.

Les exceptions ne sont généralement pas si évidentes. Supposons que vous ayez reçu les chèques d’accompagnement il y a un mois :

$225, $250, $25, $235.

Votre chèque normal est de 135 $. Quoi qu’il en soit, ce petit chèque (25 $) peut être dû au fait que vous avez pris un congé, de sorte qu’un chèque normal de 135 $, semaine après semaine, est tout sauf une véritable impression du montant que vous avez gagné. La normale de Yoru est en réalité plus proche de 237 $ dans le cas où vous retirez l’anomalie (25 $) de l’ensemble.

Il est évident qu’il n’est généralement pas si simple de tenter de découvrir des anomalies. Votre collection d’informations peut ressembler à cela :

61, 10, 32, 19, 22, 29, 36, 14, 49, 3.

On peut supposer que 3 pourraient être une exception et peut-être 61. Quoi qu’il en soit, vous n’auriez pas raison : 61 est la principale exception dans cet index informationnel.

Un graphique de cas et de poils (boxplot) montre fréquemment des anomalies :

Quoi qu’il en soit, vous ne vous approcherez peut-être pas d’un diagramme de conteneurs et de cheveux. De plus, que vous le fassiez ou non, certains boxplots peuvent ne pas présenter d’anomalies. Par exemple, ce diagramme comporte des poils qui se connectent avec des anomalies d’incorporation :

Comment trouver des valeurs aberrantes avec la méthode Tukey

La stratégie de Tukey pour découvrir des anomalies utilise l’écart interquartile pour passer au crible des nombres énormes ou extrêmement petits. C’est à toutes fins utiles équivalent à la méthode ci-dessus, mais vous pouvez voir que les recettes sont composées de façon marginale et distincte et que la formulation est également quelque peu extraordinaire. Par exemple, la technique de Tukey utilise l’idée de “mur”.

Les équations sont :

Faibles anomalies = Q1 – 1,5(Q3 – Q1) = Q1 – 1,5(IQR)

Anomalies élevées = Q3 + 1,5(Q3 – Q1) = Q3 + 1,5(IQR)

Où :

Q1 = premier quartile

Q3 = troisième quartile

IQR = Course interquartile

Ces conditions vous donnent à tous les deux de l’estime, ou des “barrières”. Vous pouvez les considérer comme une clôture qui délimite les exceptions de l’ensemble des qualités qui sont contenues dans la plus grande partie des informations.

Question test : Utilisez la stratégie de Tukey pour découvrir les exceptions à l’arrangement d’information qui l’accompagne : 1,2,5,6,7,9,12,15,18,19,38.

Première étape : Découvrez le go Interquartile :

Localisez le milieu : 1,2,5,6,7,9,12,15,18,19,38.

Placez des crochets autour des chiffres au-dessus et au-dessous du milieu – cela rend Q1 et Q3 plus simples à découvrir.

(1,2,5,6,7),9,(12,15,18,19,38)

Découvrez les Q1 et Q3. Q1 peut être considéré comme un milieu dans la moitié inférieure de l’information. Q3 peut être considéré comme un milieu pour la partie supérieure de l’information.

(1,2,5,6,7), 9, ( 12,15,18,19,38). Q1=5 et Q3=18.

Soustraire Q1 de Q3. 18-5=13.

Étape 2 : Figure 1.5 * IQR :

1,5 * IQR = 1,5 * 13 = 19,5

Étape 3 : Soustrayez de Q1 pour obtenir votre clôture inférieure :

5 – 19.5 = – 14.5

Etape 4 : Ajoutez à Q3 pour obtenir votre clôture supérieure :

18 + 19.5 = 37.5.

Étape 5 : Ajoutez votre mur à vos informations pour distinguer les exceptions :

(- 14.5) 1,2,5,6,7,9,12,15,18,19,(37.5),38.

Tout ce qui se trouve à l’extérieur du mur est une anomalie. Pour cet indice informationnel, 38 est la principale anomalie.

C’est le moyen de découvrir des exceptions avec la technique Tukey !

Retour au début

Instructions pour découvrir les anomalies avec des stratégies de pointe

Résumé de l’EDD

Le test de Grubbs.

Le test Q de Dixon.

Test de Thompson Tau modifié

Le paradigme de la pénétration