Equazione di regressione: Panoramica

Nelle statistiche viene utilizzata un’equazione di regressione per scoprire quale relazione esiste, se esiste, tra i set di dati. Ad esempio, se si misura l’altezza di un bambino ogni anno si potrebbe scoprire che cresce di circa 3 pollici all’anno. Questa tendenza (che cresce di tre pollici all’anno) può essere modellata utilizzando un’equazione di regressione. Infatti, la maggior parte delle cose nel mondo reale (dai prezzi del gas agli uragani) può essere modellata con qualche equazione; questo ci permette di prevedere gli eventi futuri.

Una linea di regressione è la linea “più adatta” per i vostri dati. Fondamentalmente, si disegna una linea che rappresenta al meglio i punti dei dati. È come una media di dove tutti i punti si allineano. Nella regressione lineare, la linea di regressione è una linea perfettamente retta:

regression line

La linea di regressione è rappresentata da un’equazione. In questo caso, l’equazione è -2,2923x + 4624,4. Ciò significa che se si volesse rappresentare l’equazione -2,2923x + 4624,4, la linea sarebbe un’approssimazione approssimativa per i dati.

Non è molto comune che tutti i punti dei dati cadano effettivamente sulla linea di regressione. Nell’immagine sopra, i punti sono leggermente sparsi intorno alla linea. In questa immagine successiva, i punti cadono sulla linea. La forma curva di questa linea è il risultato della regressione polinomiale, che si adatta ai punti in un’equazione polinomiale.

Polynomial regression results in a curved line.

Equazione di regressione: Che cos’è e come usarla

Definizioni statistiche > Cos’è un’equazione di regressione?

Equazione di regressione: Panoramica

Nelle statistiche viene utilizzata un’equazione di regressione per scoprire quale relazione esiste, se esiste, tra i set di dati. Ad esempio, se si misura l’altezza di un bambino ogni anno si potrebbe scoprire che cresce di circa 3 pollici all’anno. Questa tendenza (che cresce di tre pollici all’anno) può essere modellata utilizzando un’equazione di regressione. Infatti, la maggior parte delle cose nel mondo reale (dai prezzi del gas agli uragani) può essere modellata con qualche equazione; questo ci permette di prevedere gli eventi futuri.

Una linea di regressione è la linea “più adatta” per i vostri dati. Fondamentalmente, si disegna una linea che rappresenta al meglio i punti dei dati. È come una media di dove tutti i punti si allineano. Nella regressione lineare, la linea di regressione è una linea perfettamente retta:

linea di regressione

Una linea di regressione lineare.

La linea di regressione è rappresentata da un’equazione. In questo caso, l’equazione è -2,2923x + 4624,4. Ciò significa che se si volesse rappresentare l’equazione -2,2923x + 4624,4, la linea sarebbe un’approssimazione approssimativa per i dati.

Non è molto comune che tutti i punti dei dati cadano effettivamente sulla linea di regressione. Nell’immagine sopra, i punti sono leggermente sparsi intorno alla linea. In questa immagine successiva, i punti cadono sulla linea. La forma curva di questa linea è il risultato della regressione polinomiale, che si adatta ai punti in un’equazione polinomiale.

La regressione polinomiale risulta in una linea curva.

La regressione polinomiale risulta in una linea curva.

Linee di regressione e di previsione

La regressione è utile in quanto consente di fare previsioni sui dati. Il primo grafico sopra riportato va dal 1995 al 2015. Se si volesse prevedere cosa accadrà nel 2020, si potrebbe inserire nell’equazione:

-2.2923(2020)+4626.4 = -4.046.

Avere piogge negative non ha molto senso, ma si può dire che le precipitazioni scenderanno a 0 pollici prima del 2020. Secondo questa particolare linea di regressione, in realtà si prevede che prima o poi accadrà nel 2018:

-2.2923(2018)+4626.4 = 0.5386

-2.2923(2019)+4626.4 = -1.7537

A cosa serve un’equazione di regressione?

Le equazioni di regressione possono aiutarvi a capire se i vostri dati possono essere adatti per un’equazione. Questo è estremamente utile se volete fare delle previsioni a partire dai vostri dati – sia previsioni future che indicazioni di comportamenti passati. Ad esempio, potreste voler sapere quanto varranno i vostri risparmi in futuro. Oppure, potreste voler prevedere quanto tempo ci vorrà per guarire da una malattia.

Esistono diversi tipi di equazioni di regressione. Alcuni dei più comuni includono la Regressione lineare esponenziale e la Regressione lineare semplice (per adattare i dati a un’equazione esponenziale o a un’equazione lineare). Nelle statistiche elementari, l’equazione di regressione che si incontra più frequentemente è la forma lineare.

Calcolo della regressione lineare

Ci sono diversi modi per trovare una linea di regressione, anche a mano e con la tecnologia, come Excel (vedi sotto). Trovare una linea di regressione è molto noioso a mano. Il video seguente illustra i passi:

È possibile trovare una linea di regressione anche sulle calcolatrici TI:

TI 83 Regressione.

Come eseguire la TI-89 Regressione.

L’equazione di regressione lineare è mostrata di seguito.

regression equation

Il lato negativo dell’analisi della regressione

Affinché i dati si inseriscano in un’equazione, è necessario innanzitutto capire quale schema generale si adatta ai dati. I passi generali per eseguire la regressione includono la realizzazione di un diagramma di dispersione e poi l’ipotesi di quale tipo di equazione potrebbe essere la più adatta. Poi si può selezionare la migliore equazione di regressione per il lavoro.

regression equation 2

Tuttavia, come mostra l’immagine seguente, non è sempre del tutto facile selezionare l’equazione di regressione appropriata, soprattutto quando si ha a che fare con dati reali. A volte si ottengono dati “rumorosi” che non sembrano corrispondere a nessuna equazione. Se la maggior parte dei dati sembra seguire uno schema, si potrebbero omettere dei valori anomali. Infatti, se si ignorano i valori erratici, i dati sembrano essere modellati da un’equazione esponenziale.

regression eq