Le test du chi carré, également appelé test χ2, est un test d’hypothèse statistique dans lequel la distribution d’échantillonnage de la statistique du test est une distribution du chi carré lorsque l’hypothèse nulle est vraie. Sans autre qualification, le “test du chi carré” est souvent utilisé comme abréviation du test du chi carré de Pearson. Le test du chi carré est utilisé pour déterminer s’il y a une différence significative entre les fréquences attendues et les fréquences observées dans une ou plusieurs catégories. Dans les utilisations standard de ce test, les perceptions sont caractérisées en classes fondamentalement non liées, et il existe une hypothèse, ou une théorie d’état non valide, qui donne la probabilité que toute perception tombe dans la classe de comparaison. La motivation derrière ce test est d’évaluer la probabilité des perceptions qui sont faites, en acceptant que la spéculation invalide est valide.

Les tests du Khi-deux sont régulièrement construits à partir d’un agrégat de bévues au carré, ou par la fluctuation de l’exemple. Les résultats des tests qui poursuivent une transmission du chi carré proviennent d’une supposition d’information libre normalement diffusée, ce qui est substantiel dans l’ensemble en raison de l’hypothèse la plus probable. Un test du chi carré peut être utilisé pour tenter de rejeter la théorie non valide selon laquelle l’information est libre.

De même, le test du chi carré est un test asymptotiquement valide, ce qui implique que la circulation d’inspection (si la théorie non valide est valide) peut être rendue aussi grossière que possible en rendant l’exemple suffisamment grand.

Histoire

Au XIXe siècle, les techniques d’explication factuelle étaient, pour la plupart, appliquées à l’examen des informations organiques et il était courant pour les analystes d’accepter que les perceptions poursuivent une diffusion typique, par exemple, Sir George Breezy et le professeur Merriman, dont les travaux ont été réprimandés par Karl Pearson dans son article de 1900.  Jusqu’à la fin du XIXe siècle, Pearson a constaté la présence d’une énorme asymétrie à l’intérieur de certaines perceptions organiques. Afin de montrer que les perceptions ne se souciaient guère d’être ordinaires ou inclinées, Pearson, dans une progression d’articles distribués de 1893 à 1916, conçut la dispersion de Pearson, un groupe de transmissions de probabilité non stop, qui incorpore la diffusion typique et de nombreuses appropriations inclinées, et proposa une stratégie d’examen mesurable comprenant l’utilisation de la circulation de Pearson pour démontrer la perception et le fait de jouer l’épreuve de la décence de l’adéquation pour décider de l’adéquation réelle du modèle et de la perception.

Le test du chi carré de Pearson

Voir aussi : Le test du chi carré de Pearson

En 1900, Pearson a publié un article sur le test χ2 qui est considéré comme l’un des fondements de la statistique moderne. Dans cet article, Pearson s’est penché sur le test de la qualité de l’ajustement.

Supposons que n observations dans un échantillon aléatoire d’une population soient classées en k classes mutuellement exclusives avec des nombres observés respectifs xi (pour i = 1,2,…,k), et qu’une hypothèse nulle donne la probabilité pi qu’une observation tombe dans la ième classe. Nous avons donc les nombres attendus mi = npi pour tout i, où

Pearson a proposé que, dans la mesure où l’hypothèse nulle est correcte, comme n → ∞ la distribution limitative de la quantité donnée ci-dessous est la distribution χ2.

Pearson a géré le cas où les nombres normaux mi sont des nombres connus suffisamment énormes dans toutes les cellules en s’attendant à ce que chaque xi puisse être considéré comme circulant habituellement, et est arrivé au résultat que, dans la limite, comme n s’avère être énorme, X2 poursuit l’appropriation χ2 avec k – 1 degré d’opportunité.

Néanmoins, Pearson a ensuite examiné le cas où les nombres normaux s’appuyaient sur les paramètres qui doivent être évalués à partir de l’exemple et a recommandé que, la documentation de mi étant les véritables nombres prévus et m′i les nombres prévus évalués, la distinction

seront généralement sûrs et suffisamment peu nombreux pour être rejetés. En fin de compte, Pearson a soutenu que si par hasard nous considérions X′2 comme aussi dispersé que χ2 appropriation avec k – 1 degré d’opportunité, l’erreur dans cette estimation n’influencerait pas les choix pratiques. Cette fin a provoqué une certaine contestation dans les applications utiles n’a pas été réglée pendant 20 ans jusqu’aux documents de Fisher de 1922 et 1924.

Test du chi carré pour la variance dans une population normale

Si, par hasard, un exemple de taille n est pris auprès d’une population ayant une appropriation typique, il y a alors un résultat (voir la transmission de la fluctuation de l’exemple) qui permet de tester si le changement de population a une valeur prédéfinie. Par exemple, une procédure d’assemblage peut avoir été stable pendant une longue période, ce qui permet de résoudre la fluctuation sans erreur. Supposons qu’une variante de la procédure est en cours d’essai, offrant de monter à un petit exemple de n choses dont la variété est à essayer. La mesure test T, dans ce cas, pourrait être définie comme étant le total des carrés autour de la moyenne de l’exemple, isolé par l’incitation apparente au changement (par exemple l’incitation à essayer comme maintien). À ce stade, T a une circulation du chi carré avec n – 1 degré d’opportunité. Par exemple, si la taille de l’exemple est de 21, la zone de reconnaissance de T avec un niveau de criticité de 5% se situe quelque part entre 9,59 et 34,17.