Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Une hypothèse statistique est une hypothèse sur un paramètre de la population. Cette hypothèse peut être vraie ou non. Les tests d’hypothèse font référence aux procédures formelles utilisées par les statisticiens pour accepter ou rejeter les hypothèses statistiques.

Hypothèses statistiques

Hypothèses factuelles

L’approche la plus idéale pour décider si une théorie factuelle est authentique est de considérer l’ensemble de la population. Comme cela est régulièrement impossible, les spécialistes examinent normalement un exemple arbitraire de la population. Dans le cas où les informations de l’exemple ne concordent pas avec la spéculation factuelle, la théorie est rejetée.

Il existe deux sortes de spéculations factuelles.

Spéculation non valable. La théorie invalide, signifiée par Ho, est normalement la spéculation selon laquelle les exemples de perception résultent absolument de la possibilité.

Théorie élective. La spéculation élective, indiquée par H1 ou Ha, est la théorie selon laquelle les perceptions des exemples sont influencées par une raison non arbitraire.

Par exemple, supposons que nous devions décider si une pièce était raisonnable et ajustée. Une spéculation non valable peut être qu’une grande partie des flips provoqueraient des Pile et Demi, en Pile. La spéculation élective peut être que le nombre de Pile et de Face serait totalement différent. De manière emblématique, ces spéculations seraient communiquées comme

Ho : P = 0,5

Ha : P ≠ 0.5

Supposons que nous ayons joué à pile ou face plusieurs fois, ce qui donne environ 40 faces et 10 queues. Compte tenu de ce résultat, nous serions enclins à rejeter la spéculation non valable. Au vu de la preuve, nous conclurions que la pièce n’était très probablement pas raisonnable et ajustée.

Pouvons-nous accepter l’hypothèse nulle ?

Pouvons-nous accepter l’hypothèse nulle ?

Quelques scientifiques affirment qu’un test de spéculation peut avoir l’un des deux résultats suivants : vous reconnaissez la théorie invalide ou vous rejetez la spéculation invalide. De nombreux analystes, quoi qu’il en soit, ne sont pas d’accord avec l’idée de “tolérer la spéculation non valable”. Ils déclarent plutôt : vous rejetez la théorie non valable ou vous négligez de rejeter la spéculation non valable.

Pourquoi la qualification entre “reconnaissance” et “incapacité de licencier” ? L’acceptation suggère que la théorie invalide est valable. L’incapacité de rejeter suggère que l’information n’est pas suffisamment puissante pour que nous puissions favoriser la spéculation élective plutôt que la théorie invalide.

Tests d’hypothèse

Les analystes suivent une procédure conventionnelle pour décider s’il convient de rejeter une théorie non valable, à la lumière des informations recueillies lors des tests. Cette procédure, appelée test de spéculation, comprend quatre étapes.

Énoncer les hypothèses. Cela inclut l’expression des spéculations non valables et électives. Les spéculations sont exprimées de manière à ce qu’elles soient totalement sans rapport. C’est-à-dire que si l’une est valable, l’autre doit être fausse.

Détailler un plan d’enquête. Le plan d’examen indique comment utiliser les informations du test pour évaluer les spéculations non valables. L’évaluation est souvent centrée sur une mesure de test solitaire.

Décomposez les informations des exemples. Découvrez l’estimation de la mesure du test (score moyen, étendue, mesure t, score z, etc.) décrite dans le plan d’examen.

Interpréter les résultats. Appliquer le principe de choix décrit dans le plan d’enquête. Au cas où l’estimation de la mesure d’essai serait tirée par les cheveux, compte tenu de la théorie non valide, rejeter la spéculation non valide.

Erreurs de décision

Deux sortes de gaffes peuvent résulter d’un examen théorique.

Tapez mon erreur. Une erreur de type I se produit lorsque le scientifique rejette une théorie non valable alors qu’elle est valable. La probabilité de soumettre une erreur de type I est connue sous le nom de niveau de centralité. Cette probabilité est également appelée l’alpha et est fréquemment indiquée par α.

Erreur de type II. Une erreur de type II se produit lorsque l’analyste néglige de rejeter une spéculation non valable qui est fausse. La probabilité de soumettre une erreur de type II est appelée Bêta et est souvent désignée par β. La probabilité de ne pas soumettre une erreur de type II est connue sous le nom de Puissance du test.

Règles de décision

Le plan d’analyse comprend des règles de décision pour le rejet de l’hypothèse nulle. Dans la pratique, les statisticiens décrivent ces règles de décision de deux manières : par référence à une valeur P ou par référence à une région d’acceptation.

Valeur P. La force des preuves à l’appui d’une hypothèse nulle est mesurée par la valeur P. Supposons que la statistique du test soit égale à S. La valeur P est la probabilité d’observer une statistique de test aussi extrême que S, en supposant que l’hypothèse nulle est vraie. Si la valeur P est inférieure au niveau de signification, nous rejetons l’hypothèse nulle.

Région d’acceptation. La région d’acceptation est une gamme de valeurs. Si la statistique du test se situe dans la région d’acceptation, l’hypothèse nulle n’est pas rejetée. La région d’acceptation est définie de manière à ce que la probabilité de commettre une erreur de type I soit égale au niveau de signification.

L’ensemble des valeurs en dehors de la région d’acceptation est appelé la région de rejet. Si la statistique du test se situe dans la région de rejet, l’hypothèse nulle est rejetée. Dans ce cas, on dit que l’hypothèse a été rejetée au niveau de signification de α.

Ces approches sont équivalentes. Certains textes statistiques utilisent l’approche de la valeur P ; d’autres utilisent l’approche de la région d’acceptation. Sur ce site web, nous avons tendance à utiliser l’approche de la région d’acceptation.

Tests à une et deux queues

Un essai d’une théorie factuelle, où le lieu du licenciement se trouve d’un seul côté de la dispersion de l’examen, est connu sous le nom d’essai en une seule fois. Par exemple, supposons que la théorie non valide exprime que la moyenne n’est pas exactement ou équivalente à 10. La spéculation élective serait que la moyenne est plus importante que 10. La zone de rejet comprendrait une série de nombres situés du bon côté de l’inspection de la diffusion, c’est-à-dire beaucoup de nombres plus remarquables que 10.

Un essai de spéculation mesurable, où le lieu du licenciement se situe des deux côtés de la dispersion de l’inspection, est connu comme un test à deux volets. Par exemple, supposons que la théorie invalide exprime que la moyenne est équivalente à 10. La spéculation élective serait que la moyenne est inférieure à 10 ou plus remarquable que 10. La zone de licenciement comprendrait un éventail de chiffres situés des deux côtés du contrôle de la diffusion ; c’est-à-dire que le lieu de licenciement comprendrait principalement des chiffres inférieurs à 10 et incomplètement des chiffres supérieurs à 10