Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Statistiker verwenden zusammenfassende Maße, um das Ausmaß der Variabilität oder Streuung in einem Datensatz zu beschreiben. Die gebräuchlichsten Maße für die Variabilität sind die Spanne, die Interquartilsbreite (IQR), die Varianz und die Standardabweichung.

Der Bereich

Die Reichweite ist die Unterscheidung zwischen den größten und den kleinsten Qualitäten in vielen Qualitäten.

Denken Sie zum Beispiel an die zugehörigen Zahlen: 1, 3, 4, 5, 5, 6, 7, 11. Bei dieser Anordnung von Zahlen wäre der Bereich 11 – 1 oder 10.

Der Interquartilsbereich (IQR)

Der Interquartilen-Go (IQR) ist ein Anteil der Veränderlichkeit im Hinblick auf die Aufteilung eines Informationsindex in Quartile.

Quartile trennen einen an einer Position angeforderten Informationsindex in vier gleichwertige Teile. Die Qualitäten, die zwischen den einzelnen Teilen liegen, werden als Haupt-, zweites und drittes Quartil bezeichnet; sie werden durch Q1, Q2 und Q3 einzeln angegeben.

Q1 ist der “mittlere” Wert in der ersten Hälfte des nach Rangfolge geordneten Datensatzes.

Q2 ist der “mittlere” Wert im Satz.

Q3 ist der “mittlere” Wert in der zweiten Hälfte des nach Rangfolge geordneten Datensatzes.

Der Interquartilsbereich entspricht Q3 abzüglich Q1. Denken Sie zum Beispiel an die begleitenden Zahlen: 1, 2, 3, 4, 5, 6, 7, 8

Eight numbers: 1, 2, 3, 4, 5, 6, 7, 8

Q2 ist die Mitte des gesamten Informationsindex – der Mittelwert. In diesem Modell haben wir eine gerade Anzahl von Datenpunkten, so dass der Mittelwert dem Normal der beiden Mittelwertqualitäten entspricht. Auf diese Weise ist Q2 = (4 + 5)/2 oder Q2 = 4,5. Q1 ist das Zentrum eines Anreizes im Hauptteil des Informationsindexes. Q1 ist der mittlere Wert in der ersten Hälfte des Datensatzes. Da es eine gerade Anzahl von Datenpunkten in der ersten Hälfte des Datensatzes gibt, ist der mittlere Wert der Mittelwert der beiden mittleren Werte, d.h. Q1 = (2 + 3)/2 oder Q1 = 2,5. Q3 ist das Zentrum eines Anreizes in den zweiten 50% des Datensatzes. Da die zweiten 50% der Informationssammlung eine große Anzahl von Wahrnehmungen haben, ist der Mittelwert wiederum der Normalwert der beiden mittleren Qualitäten, d.h. Q3 = (6 + 7)/2 oder Q3 = 6,5. Der Interquartilsbereich ist Q3 minus Q1, also IQR = 6,5 – 2,5 = 4.

Beachten Sie, dass dieses Verfahren den Informationsindex in vier gleich große Stücke unterteilt hat. Das Anfangssegment besteht aus 1 und 2; der nachfolgende Abschnitt aus 3 und 4; der dritte Abschnitt aus 5 und 6; und der vierte Abschnitt aus 7 und 8.

Die Varianz

In einer Bevölkerung ist die Varianz die normale quadratische Abweichung vom Bevölkerungsdurchschnitt, wie sie durch das zugehörige Rezept charakterisiert wird:

σ2 = Σ ( Xi – μ )2/N

wobei σ2 die Bevölkerungsvarianz, μ der Bevölkerungsmittelwert, Xi die i-te Komponente aus der Bevölkerung und N die Anzahl der Komponenten in der Bevölkerung ist.

Wahrnehmungen aus einem einfachen willkürlichen Beispiel können zur Beurteilung der Differenz einer Bevölkerung verwendet werden. Aus diesem Grund ist die Stichprobenvarianz durch eine etwas einzigartige Formel gekennzeichnet und verwendet eine etwas andere Notation:

s2 = Σ ( xi – x )2/( n – 1 )

wobei s2 die Beispieländerung, x der Mittelwert aus dem Beispiel, xi die i-te Komponente aus dem Beispiel und n die Anzahl der Komponenten im Beispiel ist. Bei Verwendung dieser Formel kann die Beispieldifferenz als ein unparteiisches Maß für die tatsächliche Bevölkerungsfluktuation angesehen werden. In diesem Sinne ist dies das Rezept für den Fall, dass Sie zufällig einen obskuren Bevölkerungsunterschied im Lichte der Informationen aus einem einfachen unregelmäßigen Beispiel beurteilen müssen.

Die Standardabweichung

Die Standardabweichung ist die quadratische Basis der Änderung. Entlang dieser Linien ist die Standardabweichung einer Bevölkerung:

σ = sqrt [ σ2 ] = sqrt [ Σ ( Xi – μ )2/N ]

wobei σ die Bevölkerungsstandardabweichung, μ der Bevölkerungsmittelwert, Xi die i-te Komponente aus der Bevölkerung und N die Anzahl der Komponenten in der Bevölkerung ist.

Analysten verwenden häufig grundlegende unregelmäßige Beispiele, um die Standardabweichung einer Population im Lichte von Testinformationen zu messen. Bei einem einfachen, willkürlichen Beispiel ist der beste Maßstab für die Standardabweichung einer Population:

s = sqrt [ s2 ] = sqrt [ Σ ( xi – x )2/( n – 1 ) ] ]

wobei s die Standardabweichung des Beispiels, x der Mittelwert des Beispiels, xi die i-te Komponente aus dem Beispiel und n die Anzahl der Komponenten im Beispiel ist.

Auswirkung der Änderung von Einheiten

Von Zeit zu Zeit wechseln die Spezialisten die Einheiten (Minuten zu Stunden, Fuß zu Meter usw.). Im Folgenden wird erläutert, wie die Maße der Variabilität beeinflusst werden, wenn wir die Einheiten wechseln.

Für den unwahrscheinlichen Fall, dass Sie jeder Wertschätzung einen Stetigen hinzufügen, ändert sich die Trennung zwischen den Qualitäten nicht. Infolgedessen bleiben alle Variabilitätsmaße (Spannweite, Interquartilsabstand, Standardabweichung und Varianz) gleich.

Dann wiederum nehmen wir an, Sie erhöhen jeweils einen Anreiz durch einen Stetigen. Dies hat zur Folge, dass die Spanne, der Interquartilsabstand (IQR) und die Standardabweichung um diesen Konsistenten erhöht werden. Dies hat eine viel deutlichere Auswirkung auf die Änderung. Sie erhöht die Differenz um das Quadrat des Konsistenten.

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.