Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Wahrscheinlich wissen Sie inzwischen, dass Sie, wann immer es möglich ist, datengestützte Entscheidungen am Arbeitsplatz treffen sollten. Ist Ihnen jedenfalls klar, wie Sie die meisten der Ihnen zugänglichen Informationen analysieren können? Glücklicherweise müssen Sie wahrscheinlich nicht selbst rechnen (Gott sei Dank!), aber Sie müssen die von Ihren Partnern vorgenommene Untersuchung effektiv verstehen und übersetzen.

Um diese Strategie und die Art und Weise, wie Unternehmen sie anwenden, besser zu verstehen, habe ich mit Tom Redman, dem Autor von Data Driven, gesprochen: Profitieren Sie von Ihrem wichtigsten Geschäftsvermögen. Außerdem fordert er die Verbände auf, ihre Informations- und Informationsqualitätsprojekte zu unterstützen.

Was ist eine Regressionsanalyse?

Angenommen, Sie sind ein Projektleiter, der versucht, die Zahlen für einen Monat vorauszusehen. Sie sind sich bewusst, dass eine Handvoll, vielleicht sogar viele Komponenten, vom Klima über den Aufstieg eines Anwärters bis hin zum Klatsch über ein so gut wie immer gelungenes Modell, die Zahl beeinflussen können. Vielleicht haben einzelne Personen in Ihrer Vereinigung sogar eine Hypothese darüber, was die größten Auswirkungen auf die Geschäfte haben wird: “Vertrauen Sie mir. Je mehr Regen wir haben, desto mehr verkaufen wir.” “Sechs Wochen nach der Werbeaktion des Konkurrenten springt der Umsatz in die Höhe.”

Die Regressionsanalyse ist eine Möglichkeit, mathematisch herauszufinden, welche dieser Variablen tatsächlich einen Einfluss hat. Es beantwortet die Fragen: Welche Faktoren sind am wichtigsten? Welche können wir ignorieren? Wie interagieren diese Faktoren miteinander? Und, vielleicht am wichtigsten, wie sicher sind wir uns bei all diesen Faktoren?

In der Regressionsanalyse werden diese Faktoren als Variablen bezeichnet.

Bei der Rückfalluntersuchung werden diese Elemente als Faktoren bezeichnet. Sie haben Ihre abhängige Variable – den Hauptfaktor, den Sie zu verstehen oder vorherzusagen versuchen. In Redmans Modell über, ist die abhängige Variable Monat für Monat Geschäfte. Und danach haben Sie Ihre autonomen Faktoren – die Elemente, die Ihrer Meinung nach Ihre abhängige Variable beeinflussen.

Wie funktioniert das?

Um eine Rückfalluntersuchung zu leiten, stellen Sie die Daten zu den betreffenden Variablen zusammen. (Update: Sie müssen dies wahrscheinlich nicht ohne die Hilfe anderer tun, aber es ist nützlich für Sie, um das Verfahren zu verstehen, das Ihr Informationsprüfer-Mitarbeiter anwendet). Sie nehmen den größten Teil Ihrer monatlichen Geschäftszahlen für die letzten drei Jahre, den Staat, die letzten drei Jahre und alle Informationen über die kostenlosen Faktoren, die Ihnen wichtig sind. Nehmen wir also an, dass Sie für diese Situation die normalen monatlichen Niederschläge für bis zu drei Jahre zurück entdecken. An diesem Punkt stellen Sie den Großteil dieser Daten in einem Diagramm dar, das diesem ähnelt:

Der y-Pivot ist das Maß für die Angebote (die abhängige Variable, das, worauf Sie Wert legen, befindet sich durchweg auf dem y-Hub), und der x-Hub ist der Gesamtniederschlag. Jeder blaue Punkt spricht für die Informationen eines Monats – die Menge, die in diesem Monat heruntergeworfen wurde, und die Anzahl der Angebote, die Sie im entsprechenden Monat gemacht haben.

Wenn Sie sich diese Informationen anschauen, werden Sie wahrscheinlich feststellen, dass an Tagen, an denen es eine Tonne regnet, die Geschäfte höher sind. Das ist faszinierend zu wissen, aber in welcher Höhe? Wissen Sie, wie viel Sie verkaufen werden, wenn es 3 Zoll regnet? Was ist, wenn es 4 Zoll regnet?

Gegenwärtig stellen wir uns vor, eine Linie durch das Diagramm zu ziehen, die im Allgemeinen durch die Mitte der beträchtlichen Anzahl von Informationsschwerpunkten verläuft. Diese Zeile ermöglicht es Ihnen, mit einer gewissen Überzeugung zu antworten, wie viel Sie normalerweise verkaufen, wenn es eine bestimmte Summe regnet.

Diese wird Regressionslinie genannt und wird (unter Verwendung eines Statistikprogramms wie SPSS oder STATA oder sogar Excel) gezeichnet, um die Linie anzuzeigen, die am besten zu den Daten passt. Redman stellt sozusagen klar: “Die rote Linie ist die beste Verdeutlichung des Zusammenhangs zwischen der autonomen Variable und der Stationsvariablen.

Zusätzlich zum Zeichnen der Linie gibt Ihr Statistikprogramm auch eine Formel aus, die die Steigung der Linie erklärt und in etwa so aussieht:

Ignorieren Sie den Fehlerbegriff vorerst. Er bezieht sich auf die Tatsache, dass die Regression nicht ganz präzise ist. Konzentrieren Sie sich einfach auf das Modell:

Ignorieren Sie den Fehlerbegriff vorerst. Er bezieht sich auf die Tatsache, dass die Regression nicht ganz präzise ist. Konzentrieren Sie sich einfach auf das Modell:

Was diese Formel sagt, ist, dass, wenn es kein “x” gibt, Y = 200 ist. Auf diese Weise haben Sie nachweislich, als es beim besten Willen nicht geregnet hat, durchschnittlich 200 Verkäufe getätigt, und Sie können hoffen, dass Sie das Äquivalent erreichen, wenn Sie erwarten, dass verschiedene Faktoren gleich bleiben. Außerdem haben Sie zuvor für jeden zusätzlichen Zentimeter des Regengusses ein Normal von fünf zusätzlichen Geschäften gemacht: “Für jeden zusätzlichen Zentimeter, den x um eins steigt, steigt y um fünf”, sagt Redman.

Derzeit sollten wir auf den Fehlerbegriff zurückkommen. Vielleicht werden Sie sich zu der Aussage verleiten lassen, dass ein Regenguss große Auswirkungen auf die Geschäfte hat, wenn Sie für jeden Zentimeter fünf zusätzliche Geschäfte erhalten, doch ob diese Variable Ihre Berücksichtigung verdient, hängt von dem Fehlerbegriff ab. Eine Regressionsgerade hat immer einen Fehlerterm, da unabhängige Variablen im wirklichen Leben niemals perfekte Prädiktoren für die abhängigen Variablen sind. Oder vielleicht ist die Linie ein Maßstab, der von den zugänglichen Informationen abhängt. Der Fehlerbegriff verrät Ihnen also, wie sicher Sie sich über das Rezept sein können. Je größer sie ist, desto unsicherer ist die Rückfalllinie.

Das obige Modell verwendet nur eine einzige Variable, um den Faktor der Intrige vorauszusehen – denn in dieser Situation regnet es, um Geschäfte vorwegzunehmen. Normalerweise beginnt man mit der Aregressionsanalyse, um die Wirkung einiger unabhängiger Variablen zu verstehen. Sie können also sowohl Niederschläge als auch Informationen über den Aufstieg eines Bewerbers einbeziehen. “Sie machen so lange weiter, bis der Fehlerbegriff klein ist”, sagt Redman, “Sie versuchen, die Zeile zu bekommen, die am besten zu Ihren Informationen passt”. Während der Versuch, eine übermäßige Anzahl von Faktoren in eine Rückfalluntersuchung einzubeziehen, Gefahren bergen kann, können talentierte Ermittler diese Gefahren begrenzen. Darüber hinaus ist es vielleicht der größte Spielraum für einen Rückfall, über die Wirkung verschiedener Faktoren ohne Verzögerung nachzudenken.