Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Значение P, первоначально вычисленное вероятность, является вероятностью нахождения наблюдаемых результатов, или более экстремальных результатов, когда нулевая гипотеза (H0) вопроса исследования верна – это определение “экстремальности” зависит от того, как эта гипотеза тестируется. P также описывается с точки зрения отклонения H0, когда она действительно верна, но это не является прямой вероятностью такого состояния.

Нулевой гипотезой обычно является гипотеза “без разницы”, т.е. без разницы между группой А и группой В кровяного давления. Четко определите нулевую гипотезу для каждого вопроса исследования до начала исследования.

Единственная ситуация, в которой следует использовать одностороннее значение P, – это когда большое изменение в неожиданном направлении не будет иметь абсолютно никакого отношения к вашему исследованию. Такая ситуация необычна; если вы сомневаетесь, используйте двустороннее P-значение.

Используйте термин “уровень значимости” (альфа) как указание на вероятность доэлты, а термин “P-значение” используется для указания вероятности, которая вычисляется после данного исследования.

Альтернативная гипотеза (H1) является противоположностью нулевой гипотезы; другими словами, это обычно та гипотеза, которую вы хотите исследовать. Например, в ней спрашивается “существует ли значительная разница (не случайная) в кровяном давлении между группами А и В, если мы дадим группе А тестовое лекарство, а группе В – сахарную таблетку”, а альтернативная гипотеза – “есть ли разница в кровяном давлении между группами А и В, если мы дадим группе А тестовое лекарство, а группе В – сахарную таблетку”.

Если ваше значение Р ниже выбранного уровня значимости, то вы отвергаете нулевую гипотезу, т.е. соглашаетесь с тем, что ваш образец дает разумные доказательства в поддержку альтернативной гипотезы. Это НЕ означает “существенное” или “важное” различие; вы сами должны решить, когда рассматривать актуальность вашего результата в реальном мире.

Выбор уровня значимости, на котором вы отвергаете H0, является произвольным. Условно использовались 5% (менее 1 из 20 шансов на ошибку), 1% и 0,1% (P < 0,05, 0,01 и 0,001) уровней. Такие числа могут дать ложное чувство уверенности.

Если бы мы были в идеальном мире, то смогли бы определить “идеальную” случайную выборку, наиболее подходящий тест и окончательное заключение. Мы просто не можем. Что мы можем сделать, так это попытаться оптимизировать все этапы нашего исследования, чтобы свести к минимуму источники неопределенности. Представляя значения P, некоторые группы находят полезным использование системы оценки со звездочкой и цитату из значения P:

P < 0.05 *

P < 0.01 **

P < 0.001

Большинство авторов ссылаются на то, что P < 0.05 является статистически значимым, а P < 0.001 – очень статистически значимым (менее одного шанса из тысячи ошибиться).

Звездочка системы избегает термина “значимый”. Обратите внимание, однако, что многие статистики не ценят систему со звездочкой, когда она используется, не показывая значения P. Как правило, если вы можете процитировать точное значение P, то сделайте это. Вы также можете указать точное значение P, процитированное как звездочка в текстовом повествовании или контрастных таблицах в других частях отчета.

Слово об ошибке на данном этапе. Ошибка типа I – это ложное отклонение нулевой гипотезы, а ошибка типа II – это ложное принятие нулевой гипотезы. В качестве напоминания, чтобы помочь: думать, что наше циничное общество отказывается, прежде чем принять.

Уровень смысла (альфа) – вероятность ошибки I типа. Сила теста – один минус вероятность ошибки II типа (бета). Потенциал должен быть максимизирован при выборе статистических методов. Если вы хотите оценить размер выборки, то вам необходимо понимать все термины, которые здесь указаны.

В этой таблице показана связь между мощностью и погрешностью в тесте гипотезы:

DECISION
TRUTH Accept H0: Reject H0:
H0 is true: correct decision P type I error P
1-alpha alpha (significance)
H0 is false: type II error P correct decision P
beta 1-beta (power)
H0 = null hypothesis
P = probability

Пожалуйста, обратитесь к одному из общих текстов, перечисленных в справочном разделе, если вас интересует более подробная информация о теории вероятности и выборки на данный момент.

Необходимо понимать доверительные интервалы, если Вы намереваетесь цитировать значения Р в отчетах и документах. Статистические рецензенты научных журналов ожидают, что авторы будут цитировать доверительные интервалы более заметно, чем Р-значения.