Daten treiben alle Unternehmen an. Holen Sie sich die Fähigkeiten, die Sie brauchen, um sich abzuheben. +14.800 Menschen lernen bereits auf Datascience.
Der P-Wert, ursprünglich berechnete Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die beobachteten Ergebnisse oder extremere Ergebnisse zu finden, wenn die Nullhypothese (H0) einer Studienfrage wahr ist – diese Definition von “extrem” hängt davon ab, wie die Hypothese getestet wird. P wird auch im Sinne der Zurückweisung von H0 beschrieben, wenn sie tatsächlich wahr ist, aber es ist […]
Written byData Science Team
Published on20 May 2020
Copy link
Der P-Wert, ursprünglich berechnete Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die beobachteten Ergebnisse oder extremere Ergebnisse zu finden, wenn die Nullhypothese (H0) einer Studienfrage wahr ist – diese Definition von “extrem” hängt davon ab, wie die Hypothese getestet wird. P wird auch im Sinne der Zurückweisung von H0 beschrieben, wenn sie tatsächlich wahr ist, aber es ist keine direkte Wahrscheinlichkeit für diesen Zustand.
Die Nullhypothese ist in der Regel eine “Kein Unterschied”-Hypothese, z.B. kein Unterschied zwischen Blutdruck der Gruppe A und Blutdruck der Gruppe B. Definieren Sie vor Beginn der Studie eindeutig eine Nullhypothese für jede Studienfrage.
Die einzige Situation, in der Sie einen einseitigen P-Wert verwenden sollten, ist dann gegeben, wenn eine große Veränderung in eine unerwartete Richtung absolut keine Relevanz für Ihre Studie hätte. Eine solche Situation ist ungewöhnlich; verwenden Sie im Zweifelsfall einen zweiseitigen P-Wert.
Verwenden Sie den Begriff Signifikanzniveau (Alpha) als Hinweis auf eine Prä-Celta-Wahrscheinlichkeit, und der Begriff P-Wert wird verwendet, um eine Wahrscheinlichkeit anzugeben, die nach einer bestimmten Studie berechnet wird.
Die Alternativhypothese (H1) ist das Gegenteil der Nullhypothese; mit anderen Worten, dies ist normalerweise die Hypothese, die Sie untersuchen wollen. Sie fragt z.B.: “Gibt es einen signifikanten Blutdruckunterschied (nicht zufällig) zwischen den Gruppen A und B, wenn wir Gruppe A das Prüfpräparat und Gruppe B eine Zuckerpille geben”, und die Alternativhypothese lautet: “Gibt es einen Blutdruckunterschied zwischen den Gruppen A und B, wenn wir Gruppe A das Prüfpräparat und Gruppe B eine Zuckerpille geben”.
Wenn Ihr P-Wert niedriger ist als das gewählte Signifikanzniveau, lehnen Sie die Nullhypothese ab, d.h. Sie akzeptieren, dass Ihre Stichprobe angemessene Beweise zur Unterstützung der Alternativhypothese liefert. Dies impliziert KEINEN “signifikanten” oder “wichtigen” Unterschied; es liegt in Ihrer Verantwortung zu entscheiden, wann Sie die Relevanz Ihres Ergebnisses in der realen Welt in Betracht ziehen.
Die Wahl des Signifikanzniveaus, auf dem Sie H0 ablehnen, ist willkürlich. Konventionell wurden die Stufen 5% (weniger als 1 von 20 Chancen, falsch zu liegen), 1% und 0,1% (P < 0,05, 0,01 und 0,001) verwendet. Solche Zahlen können ein falsches Gefühl der Sicherheit vermitteln.
Wenn wir uns in der idealen Welt befänden, wären wir in der Lage, eine “perfekte” Zufallsstichprobe, den am besten geeigneten Test und eine endgültige Schlussfolgerung zu definieren. Wir können es nur nicht. Was wir tun können, ist zu versuchen, alle Stufen unserer Forschung zu optimieren, um die Quellen der Unsicherheit zu minimieren. Bei der Darstellung von P-Werten finden bestimmte Gruppen die Verwendung des Sternchen-Bewertungssystems und das Zitieren des P-Wertes nützlich:
P < 0.05 *
P < 0.01 **
P < 0.001
Die meisten Autoren geben an, dass P < 0,05 statistisch signifikant und P < 0,001 statistisch sehr signifikant ist (weniger als eine Chance von 1:1000, falsch zu liegen).
Das System Sternchen vermeidet den Begriff “signifikant”. Beachten Sie jedoch, dass viele Statistiker das Sternchensystem nicht schätzen, wenn es verwendet wird, ohne P-Werte anzuzeigen. Als Faustregel gilt: Wenn Sie einen genauen P-Wert angeben können, dann tun Sie dies. Möglicherweise möchten Sie sich auch auf einen exakten P-Wert beziehen, der als Sternchen in der Texterzählung oder in Kontrasttabellen in anderen Teilen eines Berichts angegeben ist.
Ein Wort zu dem Fehler an dieser Stelle. Ein Fehler vom Typ I ist die falsche Zurückweisung der Nullhypothese und ein Fehler vom Typ II ist die falsche Annahme der Nullhypothese. Zur Erinnerung, um zu helfen: Denken Sie daran, dass unsere zynische Gesellschaft sich weigert, bevor sie akzeptiert.
Die Bedeutungsebene (Alpha) ist die Wahrscheinlichkeit eines Typ-I-Fehlers. Die Potenz eines Tests ist eins minus der Wahrscheinlichkeit eines Irrtums vom Typ II (Beta). Die Potenz sollte bei der Wahl der statistischen Methoden maximiert werden. Wenn Sie die Stichprobengröße schätzen wollen, müssen Sie alle hier erwähnten Begriffe verstehen.
Diese Tabelle zeigt die Beziehung zwischen Potenz und Fehler im Hypothesentest:
DECISION
TRUTH
Accept H0:
Reject H0:
H0 is true:
correct decision P
type I error P
1-alpha
alpha (significance)
H0 is false:
type II error P
correct decision P
beta
1-beta (power)
H0 = null hypothesis
P = probability
Bitte beziehen Sie sich auf einen der allgemeinen Texte, die im Referenzabschnitt aufgeführt sind, wenn Sie an dieser Stelle an weiteren Details zur Wahrscheinlichkeits- und Stichprobentheorie interessiert sind.
Es ist notwendig, die Konfidenzintervalle zu verstehen, wenn Sie beabsichtigen, P-Werte in Berichten und Dokumenten zu zitieren. Die statistischen Gutachter wissenschaftlicher Zeitschriften erwarten von den Autoren, dass sie Konfidenzintervalle stärker zitieren als P-Werte.
Beim Verständnis der Hypothese können zwei Fehler ziemlich verwirrend sein. Diese beiden Fehler sind falsch negativ und falsch positiv. Sie können den falsch-negativen Fehler auch als Fehler vom Typ II und den falsch-positiven als Fehler vom Typ I bezeichnen. Während des Lernens denken Sie vielleicht, dass diese Fehler keinen Nutzen haben und nur Ihre Zeit […]
Mit Hilfe eines Box-Plots oder Box-and-Whisker-Plots können Sie die Verteilung der Datenbank in einer fünfstelligen Zusammenfassung darstellen. Das erste Quartil Q1 ist das Minimum, das dritte Quartil Q3 ist der Median und das fünfte Quartil Q5 ist das Maximum. Sie können die Ausreißer und ihre Werte mit Hilfe eines Boxplots finden. Sie können auch erkennen, […]
Das Erstellen eines probabilistischen Modells kann eine Herausforderung sein, erweist sich aber beim maschinellen Lernen als hilfreich. Um ein solches grafisches Modell zu erstellen, müssen Sie die probabilistischen Beziehungen zwischen den Variablen finden. Angenommen, Sie erstellen eine grafische Darstellung der Variablen. Sie müssen die Variablen als Knoten und die bedingte Unabhängigkeit als das Fehlen von […]
Data Science Team02 January 2021
Diese Website verwendet Cookies, um Ihre Erfahrung zu verbessern. Wir gehen davon aus, dass Sie damit einverstanden sind, aber Sie können sich abmelden, wenn Sie dies wünschen.Cookie-EinstellungenAKZEPTIEREN
Datenschutz- und Cookie-Richtlinie
Datenschutzübersicht
Diese Website verwendet Cookies, um Ihre Erfahrung zu verbessern, während Sie durch die Website navigieren. Von diesen Cookies werden die Cookies, die nach Bedarf kategorisiert werden, in Ihrem Browser gespeichert, da sie für das Funktionieren der grundlegenden Funktionen der Website wesentlich sind. Wir verwenden auch Cookies von Drittanbietern, mit denen wir analysieren und verstehen können, wie Sie diese Website nutzen. Diese Cookies werden nur mit Ihrer Zustimmung in Ihrem Browser gespeichert. Sie haben auch die Möglichkeit, diese Cookies zu deaktivieren. Das Deaktivieren einiger dieser Cookies kann sich jedoch auf Ihre Browser-Erfahrung auswirken.
Notwendige Cookies sind unbedingt erforderlich, damit die Website ordnungsgemäß funktioniert. Diese Kategorie enthält nur Cookies, die grundlegende Funktionen und Sicherheitsmerkmale der Website gewährleisten. Diese Cookies speichern keine persönlichen Informationen.
Diese Website verwendet Cookies, um Ihre Erfahrung zu verbessern, während Sie durch die Website navigieren. Von diesen Cookies werden die Cookies, die nach Bedarf kategorisiert werden, in Ihrem Browser gespeichert, da sie für das Funktionieren der grundlegenden Funktionen der Website wesentlich sind. Wir verwenden auch Cookies von Drittanbietern, mit denen wir analysieren und verstehen können, wie Sie diese Website nutzen. Diese Cookies werden nur mit Ihrer Zustimmung in Ihrem Browser gespeichert. Sie haben auch die Möglichkeit, diese Cookies zu deaktivieren. Das Deaktivieren einiger dieser Cookies kann sich jedoch auf Ihre Browser-Erfahrung auswirken.