Regressionsgleichung: Überblick

Eine Regressionsgleichung wird in der Statistik verwendet, um herauszufinden, welche Beziehung, wenn überhaupt, zwischen den Datensätzen besteht. Wenn Sie z.B. die Größe eines Kindes jedes Jahr messen, können Sie feststellen, dass es pro Jahr etwa 3 Zoll wächst. Dieser Trend (der um drei Zoll pro Jahr zunimmt) kann mit Hilfe einer Regressionsgleichung modelliert werden. Tatsächlich können die meisten Dinge in der realen Welt (von den Gaspreisen bis hin zu Wirbelstürmen) mit Hilfe einer Gleichung modelliert werden; dies ermöglicht es uns, zukünftige Ereignisse vorherzusagen.

Eine Regressionslinie ist die “geeignetste” Linie für Ihre Daten. Im Grunde genommen zeichnen Sie eine Linie, die die Datenpunkte am besten repräsentiert. Sie ist wie ein Durchschnitt, auf dem alle Punkte ausgerichtet sind. Bei der linearen Regression ist die Regressionslinie eine vollkommen gerade Linie:

regression line

Die Regressionsgerade wird durch eine Gleichung dargestellt. In diesem Fall lautet die Gleichung -2,2923x + 4624,4. Das heißt, wenn Sie die Gleichung -2,2923x + 4624,4 grafisch darstellen würden, wäre die Linie eine grobe Annäherung für Ihre Daten.

Es ist nicht sehr häufig, dass alle Datenpunkte tatsächlich auf die Regressionsgerade fallen. In der obigen Abbildung sind die Punkte leicht um die Linie herum verstreut. In diesem nächsten Bild fallen die Punkte auf die Linie. Die gekrümmte Form dieser Linie ist das Ergebnis einer polynomialen Regression, die die Punkte in eine polynomiale Gleichung einpasst.

Polynomial regression results in a curved line.

Regressionsgleichung: Was sie ist und wie man sie verwendet

Statistische Definitionen > Was ist eine Regressionsgleichung?

Eine Regressionsgleichung: Übersicht

Eine Regressionsgleichung wird in der Statistik verwendet, um herauszufinden, welche Beziehung, wenn überhaupt, zwischen den Datensätzen besteht. Wenn Sie z.B. die Größe eines Kindes jedes Jahr messen, können Sie feststellen, dass es pro Jahr etwa 3 Zoll wächst. Dieser Trend (der um drei Zoll pro Jahr zunimmt) kann mit Hilfe einer Regressionsgleichung modelliert werden. Tatsächlich können die meisten Dinge in der realen Welt (von den Gaspreisen bis hin zu Wirbelstürmen) mit Hilfe einer Gleichung modelliert werden; dies ermöglicht es uns, zukünftige Ereignisse vorherzusagen.

Eine Regressionslinie ist die “geeignetste” Linie für Ihre Daten. Im Grunde genommen zeichnen Sie eine Linie, die die Datenpunkte am besten repräsentiert. Sie ist wie ein Durchschnitt, auf dem alle Punkte ausgerichtet sind. Bei der linearen Regression ist die Regressionslinie eine vollkommen gerade Linie:

Regressionsgerade

Eine lineare Regressionsgerade.

Die Regressionsgerade wird durch eine Gleichung dargestellt. In diesem Fall lautet die Gleichung -2,2923x + 4624,4. Das heißt, wenn Sie die Gleichung -2,2923x + 4624,4 grafisch darstellen würden, wäre die Linie eine grobe Annäherung für Ihre Daten.

Es ist nicht sehr üblich, dass alle Datenpunkte tatsächlich auf die Regressionsgerade fallen. In der obigen Abbildung sind die Punkte leicht um die Linie herum verstreut. In diesem nächsten Bild fallen die Punkte auf die Linie. Die gekrümmte Form dieser Linie ist das Ergebnis einer polynomialen Regression, die die Punkte in eine polynomiale Gleichung einpasst.

Die polynomiale Regression führt zu einer gekrümmten Linie.

Die polynomiale Regression führt zu einer gekrümmten Linie.

Regressions- und Prädiktionslinien

Die Regression ist nützlich, da sie es Ihnen ermöglicht, Vorhersagen über die Daten zu treffen. Die erste obige Abbildung zeigt den Zeitraum von 1995 bis 2015. Wenn Sie vorhersagen wollten, was im Jahr 2020 geschehen wird, könnten Sie es in die Gleichung einbeziehen:

-2.2923(2020)+4626.4 = -4.046.

Negativer Regen macht nicht viel Sinn, aber man kann sagen, dass der Niederschlag vor 2020 auf 0 Zoll fallen wird. Gemäß dieser speziellen Regressionslinie wird dies früher oder später im Jahr 2018 erwartet:

-2.2923(2018)+4626.4 = 0.5386

-2.2923(2019)+4626.4 = -1.7537

Wozu dient eine Regressionsgleichung?

Regressionsgleichungen können Ihnen helfen zu verstehen, ob Ihre Daten für eine Gleichung geeignet sein könnten. Dies ist äußerst nützlich, wenn Sie aus Ihren Daten Vorhersagen machen wollen – sowohl zukünftige Vorhersagen als auch Hinweise auf vergangenes Verhalten. Zum Beispiel möchten Sie vielleicht wissen, wie viel Ihre Ersparnisse in der Zukunft wert sein werden. Oder Sie möchten vielleicht vorhersagen, wie lange es dauern wird, sich von einer Krankheit zu erholen.

Es gibt verschiedene Arten von Regressionsgleichungen. Zu den gebräuchlichsten gehören die Exponentielle Lineare Regression und die Einfache Lineare Regression (zur Anpassung von Daten an eine Exponentialgleichung oder lineare Gleichung). In der Elementarstatistik ist die Regressionsgleichung, die Ihnen am häufigsten begegnet, die lineare Form.

Berechnung der linearen Regression

Es gibt mehrere Möglichkeiten, eine Regressionsgerade zu finden, auch von Hand und mit Hilfe von Technologie, wie z.B. Excel (siehe unten). Eine Regressionsgerade zu finden, ist von Hand sehr langweilig. Das folgende Video veranschaulicht die Schritte:

Sie können eine Regressionsgerade auch auf den TI-Rechnern finden:

TI 83 Regression.

Wie man die TI-89-Regression durchführt.

Die lineare Regressionsgleichung ist unten dargestellt.

regression equation

Die Kehrseite der Regressionsanalyse

Damit die Daten in eine Gleichung passen, müssen Sie zunächst verstehen, welches allgemeine Schema zu den Daten passt. Die allgemeinen Schritte zur Durchführung einer Regression umfassen die Erstellung eines Dispersionsdiagramms und dann die Aufstellung einer Hypothese darüber, welche Art von Gleichung am besten geeignet ist. Dann können Sie die beste Regressionsgleichung für die Aufgabe auswählen.

regression equation 2

Wie das folgende Bild zeigt, ist es jedoch nicht immer ganz einfach, die geeignete Regressionsgleichung auszuwählen, insbesondere wenn es sich um reale Daten handelt. Manchmal erhält man “verrauschte” Daten, die in keine Gleichung zu passen scheinen. Wenn die meisten Daten einem Muster zu folgen scheinen, können Sie Ausreißer auslassen. Wenn Sie die Ausreißer ignorieren, scheinen die Daten tatsächlich durch eine Exponentialgleichung modelliert zu sein.

regression eq