Nelle circostanze e nella relazione logica dei risultati, la variabile autonoma è la ragione, e la variabile dipendente è l’impatto. La ricaduta diretta dei minimi quadrati è una strategia per prevedere la stima di una variabile bisognosa Y, alla luce della stima di un fattore libero X.

Requisiti per la regressione

La ricaduta diretta di base è corretta quando sono soddisfatte le condizioni che la accompagnano.

La variabile bisognosa Y ha una relazione diretta con la variabile autonoma X. Per verificare questo, assicurarsi che lo scatterplot XY sia diretto e che il rimanente plot mostri un esempio irregolare. (Cercate di non stressare, in un esercizio futuro copriremo gli avanzi di terreno).

Per ogni stima di X, la trasmissione di probabilità di Y ha una deviazione standard simile σ. Nel momento in cui questa condizione è soddisfatta, la fluttuazione dei residui sarà generalmente una stima complessiva coerente di X, che viene effettivamente controllata in un grafico rimanente.

Per una stima casuale di X,

Le stime Y sono libere, come dimostra un esempio arbitrario della trama rimanente.

Le stime Y sono generalmente trasmesse normalmente (cioè simmetriche e unimodali). Un po’ di asimmetria va bene se la dimensione dell’esempio è enorme. Un istogramma o una trama a punti mostrerà lo stato della trasmissione.

La linea di riapertura delle piazze

La ricaduta diretta trova la linea retta, chiamata linea di ricaduta dei minimi quadrati o LSRL, che meglio parla alle percezioni in una raccolta informativa bivariata. Si supponga che Y sia una variabile bisognosa e che X sia un fattore libero. La linea di ricaduta della popolazione è:

Y = Β0 + Β1X

dove Β0 è una costante, Β1 è il coefficiente di ricaduta, X è la stima della variabile autonoma, e Y è la stima della variabile bisognosa.

Dato un esempio irregolare di percezione, la linea di ricaduta della popolazione è valutata da:

ŷ = b0 + b1x

dove b0 è una costante, b1 è il coefficiente di ricaduta, x è la stima della variabile autonoma, e ŷ è la stima anticipata della variabile bisognosa.

Istruzioni per caratterizzare una linea di regressione

Normalmente, per scoprire b0 e b1 si utilizza un dispositivo di calcolo – un bundle di prodotti (ad esempio, Superare le aspettative) o una macchina per l’aggiunta di diagrammi – per scoprire b0 e b1. Inserite le stime X e Y nel vostro programma o number cruncher, e lo strumento comprende per ogni parametro.

Nell’improbabile occasione in cui ci si ritrova su un’isola deserta senza un PC o un calcolatore di numeri, ci si può accontentare di b0 e b1 “a mano”. Ecco le condizioni.

b1 = Σ [ (xi – x)(yi – y) ]/Σ [ (xi – x)2]

b1 = r * (sy/sx)

b0 = y – b1 * x

dove b0 è costante nella condizione di ricaduta, b1 è il coefficiente di ricaduta, r è la connessione tra x e y, xi è la stima X della percezione I, yi è la stima Y della percezione I, x è la media di X, y è la media di Y, sx è la deviazione standard di X, e sy è la deviazione standard di Y.

Proprietà della linea di rilancio

Nel punto in cui i parametri di ricaduta (b0 e b1) sono caratterizzati come descritti sopra, la linea di ricaduta ha le proprietà che la accompagnano.

La linea limita l’insieme dei contrasti al quadrato tra le stime guardate (le stime y) e le qualità anticipate (i valori ŷ elaborati dalla condizione di ricaduta).

La linea di ricaduta passa attraverso la media delle stime X (x) e attraverso la media delle stime Y (y).

La costante di ricaduta (b0) è equivalente al blocco y della linea di ricaduta.

Il coefficiente di ricaduta (b1) è la normale variazione della variabile bisognosa (Y) per una variazione di 1 unità della variabile autonoma (X). È l’inclinazione della linea di ricaduta.

La linea di regressione dei minimi quadrati è l’unica linea retta che ha tutte queste proprietà.

Il coefficiente di determinazione

Il coefficiente di determinazione (indicato da R2) è un rendimento chiave dell’indagine sulle ricadute. Viene decifrato come l’entità della variazione della variabile dipendente che non sorprende dal fattore libero.

Il coefficiente di assicurazione varia da 0 a 1.

Un R2 di 0 implica che la variabile dipendente non può essere anticipata dal fattore libero.

Un R2 di 1 implica che la variabile bisognosa può essere anticipata senza errori dalla variabile autonoma.

Un R2 da qualche parte nell’intervallo 0 e 1 mostra il grado in cui la variabile dipendente non è sorprendente. Un R2 di 0,10 implica che il 10 per cento della differenza in Y non è sorprendente rispetto a X; un R2 di 0,20 implica che il 20 per cento non è sorprendente, ecc.

L’equazione per l’elaborazione del coefficiente di assicurazione per un modello a ricaduta diretta con un fattore libero è data sotto.