Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Статистическая гипотеза – это предположение о параметре популяции. Это предположение может быть или не быть верным. Тестирование гипотез относится к формальным процедурам, используемым статистиками для принятия или отклонения статистических гипотез.

Статистические гипотезы

Фактические гипотезы

Самый идеальный подход, чтобы решить, является ли фактическая теория подлинной, это посмотреть на все население. Так как это обычно невыполнимо, специалисты обычно смотрят на произвольный пример со стороны населения. В случае, если информация о примере не согласуется с фактическими рассуждениями, теория отвергается.

Существуют два вида фактических предположений.

Недействительные спекуляции. Недействительной теорией, обозначенной Хо, обычно является предположение, что примеры восприятия являются абсолютно возможными.

Избирательная теория. Избирательная спекуляция, обозначаемая Н1 или Ха, является теорией, согласно которой на образцовые восприятия оказывает влияние некоторая непроизвольная причина.

Например, предположим, что нам необходимо решить, является ли монета разумной и скорректированной. Недобросовестные домыслы могут заключаться в том, что большая часть переворотов принесет в Хвостах Орел с половиной. Избранная догадка может заключаться в том, что количество Орел и Решек будет совершенно разным. Символично, что эти домыслы будут сообщены как

P = 0.5

Ха: P ≠ 0.5

Предположим, мы подбросили монету несколько раз, в результате чего получилось около 40 голов и 10 хвостов. Учитывая этот результат, мы были бы наклонны, чтобы отвергнуть недействительные спекуляции. Мы бы закончили, в связи с доказательством, что монета, скорее всего, не была разумной и скорректированной.

Можем ли мы принять гипотезу “Налл”?

Можем ли мы принять гипотезу “Налл”?

Несколько ученых утверждают, что проверка спекуляции может иметь один из двух результатов: вы признаете недействительной теории или вы отвергаете недействительные спекуляции. Многочисленные аналитики, как бы то ни было, не согласны с мыслью о “терпимом отношении к недействительным домыслам”. Вместо этого они утверждают: вы отвергаете недействительную теорию или пренебрегаете недействительными спекуляциями.

Почему квалификация между “признанием” и “неспособностью отвергнуть”? Признание предполагает, что недействительная теория действительна. Неспособность отвергнуть предполагает, что информация недостаточно сильна для того, чтобы мы могли отдать предпочтение электоральным спекуляциям перед недействительной теорией.

Испытания гипотезы

Аналитики применяют обычную процедуру для принятия решения об отклонении недействительной теории в свете информации, полученной в ходе испытаний. Эта процедура, называемая тестированием на спекуляцию, состоит из четырех этапов.

Изложите гипотезы. Это включает в себя выражение недействительных и факультативных предположений. Спекуляции выражаются таким образом, что они совершенно не связаны друг с другом. То есть, если одна из них действительна, то другая должна быть ложной.

Подробно опишите план расследования. В плане экспертизы показано, как использовать тестовую информацию для оценки недействительных предположений. Оценка часто концентрируется на одиночном измерении теста.

Разбейте информацию о примерах. Расскажите об оценке результатов измерения (средняя оценка, степень, измерение t, z-оценка и т. д.), приведенной в плане экспертизы.

Интерпретировать результаты.  Применить принцип выбора, отраженный в плане обследования. С учетом недействительной теории исключить вероятность того, что оценка тестового измерения является надуманной, отвергнуть недействительную спекуляцию.

Ошибки в принятии решений

Два вида промахов могут быть результатом теоретического теста.

Ошибка первого типа. Ошибка типа I происходит, когда ученый отклоняет недействительную теорию, когда она является действительной. Вероятность допустить ошибку I типа известна как уровень централизации. Эта вероятность также называется альфа и часто обозначается α.

Ошибка типа II. Ошибка типа II случается, когда аналитик пренебрегает игнорированием недействительных предположений, которые являются ложными. Вероятность допустить ошибку типа II называется Beta и часто обозначается β. Вероятность не допустить ошибку типа II называется Power of the test (Сила теста).

Правила принятия решений

В план анализа включены правила принятия решения об отклонении нулевой гипотезы. На практике статистики описывают эти правила принятия решений двумя способами – со ссылкой на значение Р или со ссылкой на регион принятия.

Р-значение. Сила доказательств в поддержку нулевой гипотезы измеряется значением Р. Предположим, что тестовая статистика равна S. Р-значение – это вероятность наблюдения тестовой статистики столь же экстремальной, как и S, в предположении, что нулевая гипотеза верна. Если P-значение меньше уровня значимости, то мы отвергаем нулевую гипотезу.

Область принятия. Область принятия – это диапазон значений. Если тестовая статистика попадает в область принятия, то нулевая гипотеза не отвергается. Область принятия определяется таким образом, что вероятность ошибки I типа равна уровню значимости.

Набор значений вне области принятия называется областью отклонения. Если тестовая статистика попадает в область отклонения, то нулевая гипотеза отвергается. В таких случаях мы говорим, что гипотеза отвергается на α-уровне значимости.

Эти подходы эквивалентны. В одних статистических текстах используется подход с P-значением, в других – подход с областью принятия. На этом сайте мы склонны использовать подход, основанный на области принятия.

Одно- и двухсторонние тесты

Испытание фактической теории, где место увольнения находится лишь на одной стороне экзаменационного рассеяния, известно как однопроходное испытание. Например, предположим, что недействительная теория выражает, что среднее значение не является ни точным, ни эквивалентным 10. Избранное предположение заключается в том, что среднее более заметно, чем 10. Область увольнения будет состоять из диапазона чисел, расположенных на правильной стороне инспектируемого распространения; т.е. много чисел, которые заслуживают большего внимания, чем 10.

Испытание измеримой спекуляции, в которой место увольнения находится на двух сторонах инспектирующего рассеяния, известно как двухстороннее испытание. Например, предположим, что недействительная теория выражает, что среднее равно 10. Избранная спекуляция будет состоять в том, что среднее меньше 10 или более примечательных, чем 10. Область увольнения будет состоять из диапазона чисел, расположенных по обеим сторонам инспектируемого распространения; т.е. область увольнения будет состоять главным образом из чисел, не достигших 10, и неполных чисел, которые заслуживают более высокой оценки, чем 10.