Coursera Learner working on a presentation with Coursera logo and

Was ist die empirische Regel?

Coursera Learner working on a presentation with Coursera logo and

Diese Regel in der Statistik besagt, dass alle Daten, die Sie beobachten können, unter drei verschiedene Standardabweichungen des Mittelwertes in einer Normalverteilung fallen. Vielleicht kennen Sie die empirische Regel auch als 68-95-99,7-Regel oder Drei-Sigma-Regel. Nach dieser Regel fallen 68 % der Daten unter die erste Standardabweichung, 95 % unter die erste und die zweite Abweichung und 99,7 % der Daten unter alle drei Abweichungen:
68% – (µ ± σ),
95% – (µ ± 2σ)
99,7% – (µ ± 3σ)
Wenn wir eine Normalverteilung der Daten in einem Diagramm auf der x-Achse haben, wird die Glockenkurve in der Mitte liegen. Die erste Standardabweichung umfasst die positive Hälfte (µ + σ) und die negative Hälfte (µ – σ). Diese beiden Hälften der ersten Standardabweichung betragen zusammen 68%, aber wenn wir nur die positive Hälfte betrachten, beträgt sie 34%, und die negative Hälfte wäre die gleiche. In ähnlicher Weise können wir, wenn wir die zweite Standardabweichung betrachten, die positive Hälfte der ersten und zweiten Abweichung mit der negativen Seite der beiden Abweichungen addieren, so dass sie zu 95% vollständig ist. Auch bei der dritten Abweichung wären die Phänomene gleich.

Normalverteilung

Dies ist wahrscheinlich eine wesentliche Verteilung der Wahrscheinlichkeiten in der Statistik. Beispielsweise bilden Datensätze wie Herzfrequenz, Blutdruck, Körpergröße und IQ-Werte eine Glockenkurve der Normalverteilung

Die Symmetrie der Normalverteilung

Die Normalverteilung gilt für kontinuierliche Variablen. Kontinuierliche Variablen haben unendliche Werte. Sie schließen diese Werte in die Verteilung ein. Eine Normalverteilung hilft bei der Beschreibung der Art und Weise, in der Sie die Variablen verteilen. Die meisten Variablen, Daten oder Beobachtungen gruppieren sich in einer Normalverteilung zum Zentrum hin, wodurch eine Spitze entsteht. Aus diesem Grund haben die meisten Normalverteilungen eine Glockenform.
Außerdem sind bei einer Normalverteilung der Mittelwert, der Median und der Modus gleich. Es gibt eine Kurve in der Mitte, die den Mittelwert darstellt. Der linke und der rechte Wert sind jedoch gleich. Sie können die Normalverteilung durch den Mittelwert und die Standardabweichung definieren. Dies sind die beiden wesentlichen Faktoren, die die Kurve beeinflussen. 68 Prozent der Fläche fallen unter eine einzige Standardabweichung des Mittelwerts.

Parameter der Normalverteilung

Bedeutet

Wir können den Mittelwert des Datensatzes ermitteln, indem wir alle Werte addieren und die Summe durch die Anzahl der Werte teilen.

Mittelwert

Wenn Sie den Datensatz vom niedrigsten zum größten bestellen, ist der mittlere Wert der Median.

Modus

Der Modus ist der Wert, der sehr oft im Datensatz erscheint.

Standard-Abweichung

Die Standardabweichung misst, wie weit die Werte der Daten verbreitet sind. Das Symbol für die Standardabweichung ist Sigma. Die Standardabweichung ist nur die Quadratwurzel der Varianzen. Wenn Sie z.B. die Jahresrate der Investitionsrendite messen, können Sie die historische Volatilität der Investition ermitteln. Dieser Ansatz ist eine statistische Messung oder Standardabweichung.

Abweichungen

Abweichungen messen auch die Verbreitung von Werten. Dieser Begriff bezieht sich jedoch darauf, wie weit die Zahlen im Datensatz vom Mittelwert und anderen Zahlen entfernt sind

Z-Punktzahlen

Der Z-Score ist eine numerische Darstellung der Beziehung zwischen dem Mittelwert einer Gruppe und dem Wert. Mit Hilfe des Mittelwerts können Sie den Z-Score als Standardabweichungen berechnen. Wenn der Z-Score gleich Null ist, sind der Mittelwert und der Datenscore gleich. Der Z-Score kann negativ und positiv sein. Wenn ein Z-Wert negativ ist, liegt er unter dem Mittelwert, und wenn der Z-Wert über dem Mittelwert liegt, ist er positiv.

Verstehen des Konzepts der68-95-99.7-Regel

Die Normalverteilung der Daten bezieht sich im Allgemeinen auf die 68-95-99,7-Regel. Sie finden 68 % der Daten in der ersten Standardabweichung, 95 % der Daten in der zweiten Abweichung und 99,7 % der Daten in der dritten Abweichung des Mittelwerts.

Wahrscheinlichkeits-Dichte-Funktion

Um den Prozentsatz zu ermitteln, sollten Sie wissen, was die Wahrscheinlichkeitsdichtefunktion oder PDF bedeutet. Mit Hilfe von PDF können Sie die Wahrscheinlichkeit der Zufallsvariablen angeben, die in einen bestimmten Wertebereich fällt, anstatt einen anderen Wert anzunehmen. Sie können die Wahrscheinlichkeit berechnen, indem Sie das Integral der PDF der Variablen auf dem Bereich herausnehmen. Dies bedeutet, dass der Bereich in der Dichtefunktion liegt, jedoch zwischen dem höchsten und dem niedrigsten Wert und über die horizontale Achse des Bereichs.

In der ersten Standardabweichung sind 68% der Daten enthalten. Wenn Sie also die Wahrscheinlichkeit der Landung des Zufallsdatenpunktes in der ersten Standardabweichung finden möchten, müssen Sie den Mittelwert der Daten von -1 bis 1 Standardabweichung berechnen.

In der zweiten Standardabweichung sind 95% der Daten enthalten. Wenn Sie also die Wahrscheinlichkeit der Landung des Zufallsdatenpunktes in der zweiten Standardabweichung finden wollen, müssen Sie den Mittelwert der Daten aus -2 bis 2 Standardabweichungen berechnen.

In der dritten Standardabweichung sind 99,7% der Daten enthalten. Wenn Sie also die Wahrscheinlichkeit der Landung des Zufallsdatenpunktes in der dritten Standardabweichung finden wollen, müssen Sie den Mittelwert der Daten aus -3 bis 3 Standardabweichungen berechnen.

Schlussfolgerung

Durch die 68-95-99,7-Regel können wir schnell eine grobe Wahrscheinlichkeitsschätzung der Daten erhalten. Sie können diese Methode als einfachen Test verwenden, wenn die Population der Daten normal ist. Wenn die Datenpopulation jedoch nicht normal ist, können Sie diese Methode als Normalitätstest verwenden.

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.