Dans la relation des circonstances et des résultats logiques, la variable autonome est la raison, et la variable dépendante est l’impact. La rechute directe des moindres carrés est une stratégie permettant de prévoir l’estimation d’une variable autonome Y, à la lumière de l’estimation d’un facteur libre X.

Conditions de la régression

La rechute directe de base est appropriée lorsque les conditions d’accompagnement sont remplies.

La variable nécessiteuse Y a une relation directe avec la variable autonome X. Pour le vérifier, assurez-vous que le nuage de points XY est direct et que le reste du diagramme montre un exemple irrégulier. (Essayez de ne pas insister, nous couvrirons les parcelles restantes dans un prochain exercice).

Pour chaque estimation de X, la transmission de probabilité de Y a un écart-type similaire σ. Au moment où cette condition est remplie, la fluctuation des résidus sera généralement une estimation globale cohérente de X, qui est effectivement vérifiée dans une parcelle restante.

Pour une estimation aléatoire de X,

Les Y sont libres, comme le démontre un exemple arbitraire de l’intrigue restante.

Les Estimations Y sont généralement transmises de manière ordinaire (c’est-à-dire symétrique et unimodale). Un peu d’asymétrie n’est pas un problème si la taille de l’exemple est énorme. Un histogramme ou un pointillé indiquera l’état de la transmission.

La ligne de rétrocession des moindres carrés

La rechute directe trouve la ligne droite, appelée ligne de rechute des moindres carrés ou LSRL, qui correspond le mieux aux perceptions dans une collection d’informations bivariée. Supposons que Y soit une variable nécessiteuse et que X soit un facteur libre. La ligne de rechute de la population est :

Y = Β0 + Β1X

où Β0 est une constante, Β1 est le coefficient de rechute, X est l’estimation de la variable autonome, et Y est l’estimation de la variable nécessiteuse.

Étant donné un exemple de perception irrégulière, la ligne de rechute de la population est évaluée par :

ŷ = b0 + b1x

où b0 est une constante, b1 est le coefficient de rechute, x est l’estimation de la variable autonome, et ŷ est l’estimation anticipée de la variable nécessiteuse.

Instructions pour caractériser une ligne de régression

En règle générale, vous utiliserez un dispositif de calcul – un ensemble de produits (par exemple, Dépasser les attentes) ou une machine à additionner des diagrammes – pour découvrir b0 et b1. Vous entrez les estimations X et Y dans votre programme ou votre broyeur de chiffres, et l’instrument comprend pour chaque paramètre.

Dans l’éventualité improbable où vous vous retrouveriez sur une île déserte sans PC ni logiciel de calcul de cartes, vous pourrez vous contenter de b0 et b1 “à la main”. Voici les conditions.

b1 = Σ [ (xi – x)(yi – y) ]/Σ [ (xi – x)2]

b1 = r * (sy/sx)

b0 = y – b1 * x

où b0 est stable dans la condition de rechute, b1 est le coefficient de rechute, r est la connexion entre ‘x et y, xi est l’estimation X de la perception I, yi est l’estimation Y de la perception I, x est la moyenne de X, y est la moyenne de Y, sx est l’écart type de X et sy est l’écart type de Y.

Propriétés de la ligne de rechute

Au moment où les paramètres de la rechute (b0 et b1) sont caractérisés comme étant dépassés, la ligne de rechute a les propriétés correspondantes.

La ligne limite l’ensemble des contrastes carrés entre les estimations observées (les estimations y) et les qualités attendues (les valeurs ŷ traitées à partir de l’état de rechute).

La ligne de rechute passe par la moyenne des X estimés (x) et par la moyenne des Y estimés (y).

La ligne de rechute stable (b0) est équivalente au bloc y de la ligne de rechute.

Le coefficient de rechute (b1) est le changement normal de la variable des personnes nécessiteuses (Y) pour un changement de 1 unité de la variable autonome (X). Il s’agit de l’inclinaison de la ligne de rechute.

La ligne de régression des moindres carrés est la seule ligne droite qui possède toutes ces propriétés.

Le coefficient de détermination

Le coefficient de détermination (signifié par R2) est un résultat clé de l’enquête sur les rechutes. Il est déchiffré comme étant l’ampleur du changement de la variable dépendante qui n’est pas surprenante par rapport au facteur libre.

Le coefficient d’assurance varie de 0 à 1.

Un R2 de 0 implique que la variable dépendante ne peut pas être anticipée à partir du facteur libre.

Un R2 de 1 implique que la variable des besoins peut être anticipée sans erreur à partir de la variable autonome.

Un R2 compris entre 0 et 1 indique dans quelle mesure la variable dépendante n’est pas surprenante. Un R2 de 0,10 signifie que 10 % de la différence entre Y et X n’est pas surprenant ; un R2 de 0,20 signifie que 20 % n’est pas surprenant, etc.

L’équation de traitement du coefficient d’assurance pour un modèle de rechute directe avec un facteur libre est donnée ci-dessous.