Hipoteza statystyczna to założenie dotyczące parametru populacji. To założenie może, ale nie musi być prawdziwe. Testowanie hipotez odnosi się do formalnych procedur stosowanych przez statystyków w celu przyjęcia lub odrzucenia hipotez statystycznych.

Hipotezy statystyczne

Hipotezy faktyczne

Najbardziej idealnym podejściem do decydowania, czy teoria faktów jest prawdziwa, jest spojrzenie na całą populację. Ponieważ jest to regularnie niewykonalne, specjaliści zazwyczaj patrzą na arbitralny przykład z populacji. W przypadku, gdy przykładowa informacja nie jest zgodna z rzeczywistymi spekulacjami, teoria ta zostaje odrzucona.

Istnieją dwa rodzaje rzeczowych spekulacji.

Nieważne spekulacje. Nieważna teoria, oznaczana przez Ho, jest zazwyczaj spekulacją, że przykładowe postrzeganie wynika absolutnie z możliwości.

Wyborna teoria. Dobrowolne spekulacje, wskazane przez H1 lub Ha, to teoria, że na przykładowe postrzeganie wpływa jakiś niearbitralny powód.

Na przykład, załóżmy, że musieliśmy zdecydować, czy moneta jest rozsądna i dostosowana. Nieprawdziwe spekulacje mogą być takie, że duża część salta doprowadzi do głowy i połowy, w ogonach. Można spekulować, że liczba szefów i ogonów będzie zupełnie inna. Emblematycznie, te spekulacje zostałyby przekazane jako

Ho: P = 0,5

Ha: P ≠ 0,5

Załóżmy, że rzucaliśmy monetą kilka razy, przynosząc około 40 głów i 10 ogonów. Biorąc pod uwagę ten wynik, bylibyśmy skłonni odrzucić nieważne spekulacje. Skończylibyśmy, mając na uwadze dowód, że moneta najprawdopodobniej nie była rozsądna i dostosowana.

Czy możemy zaakceptować Hipotezę Zerową?

Czy możemy zaakceptować Hipotezę Zerową?

Kilku naukowców twierdzi, że test spekulacyjny może mieć jeden z dwóch wyników: potwierdzasz nieważną teorię lub odrzucasz nieważne spekulacje. Wielu analityków, tak czy inaczej, nie zgadza się z myślą o “tolerowaniu nieważnych spekulacji”. Zamiast tego twierdzą: odrzucasz nieważną teorię lub zaniedbujesz odrzucenie nieważnych spekulacji.

Dlaczego kwalifikacja wśród “uznania” i “niezdolności do zwolnienia”? Akceptacja sugeruje, że nieważna teoria jest ważna. Niezdolność do odrzucenia sugeruje, że informacje te nie są dla nas wystarczająco silne, aby faworyzować spekulacje wyborcze nad nieważną teorią.

Hipoteza Testy

Analitycy przeprowadzają konwencjonalną procedurę w celu podjęcia decyzji, czy odrzucić nieważną teorię, w świetle informacji uzyskanych z badań. Procedura ta, zwana testem spekulacyjnym, składa się z czterech etapów.

Podaj hipotezę. Obejmuje to wyrażanie nieważnych i celowych spekulacji. Spekulacje są tak sformułowane, że są one całkowicie niepowiązane. To znaczy, że w przypadku, gdy jedno jest ważne, drugie musi być fałszywe.

Szczegółowy plan dochodzenia. Plan badań przedstawia sposób wykorzystania informacji z badań do oceny nieważnych spekulacji. Ocena często koncentruje się wokół samotnego pomiaru testowego.

Rozbić przykładowe informacje. Odkryj oszacowanie pomiaru testowego (średni wynik, zakres, pomiar t, z-score itp.) przedstawione w planie badania.

Zinterpretuj wyniki. Należy stosować zasadę wyboru przedstawioną w planie dochodzenia. W związku z tym, że szacunek pomiaru testowego jest mało prawdopodobny, w świetle nieważnej teorii, należy odrzucić nieważne spekulacje.

Decyzja Błędy

Z testu teoretycznego mogą wynikać dwa rodzaje błędów.

Pomyłka typu I. Błąd typu I zdarza się, gdy naukowiec odrzuca nieważną teorię, gdy jest ona ważna. Prawdopodobieństwo popełnienia błędu typu I znane jest jako poziom centralności. Prawdopodobieństwo to nazywane jest również alfa i często wskazywane jest przez α.

Błąd typu II. Błąd typu II zdarza się wtedy, gdy analityk zaniedbuje odrzucenie nieważnych spekulacji, które są fałszywe. Prawdopodobieństwo popełnienia błędu typu II nazywane jest Beta i często oznacza β. Prawdopodobieństwo nie popełnienia błędu typu II nazywane jest Mocą badania.

Zasady podejmowania decyzji

Plan analizy zawiera zasady podejmowania decyzji o odrzuceniu hipotezy zerowej. W praktyce, statystycy opisują te zasady decyzyjne na dwa sposoby – w odniesieniu do wartości P lub w odniesieniu do regionu akceptacji.

Wartość P. Siła dowodów na poparcie hipotezy zerowej jest mierzona wartością P. Załóżmy, że statystyka testowa jest równa S. Wartość P jest prawdopodobieństwem obserwowania statystyki testowej tak skrajnej jak S, przy założeniu, że hipoteza zerowa jest prawdziwa. Jeśli wartość P jest mniejsza niż poziom istotności, odrzucamy hipotezę zerową.

Region akceptacji. Regionem akceptacji jest szereg wartości. Jeśli statystyka testowa mieści się w obszarze akceptacji, hipoteza zerowa nie jest odrzucana. Region akceptacji jest tak zdefiniowany, że szansa na popełnienie błędu typu I jest równa poziomowi istotności.

Zbiór wartości poza regionem akceptacji nazywany jest regionem odrzucenia. Jeśli statystyka testu mieści się w obszarze odrzucenia, hipoteza zerowa zostaje odrzucona. W takich przypadkach mówimy, że hipoteza ta została odrzucona na poziomie znaczenia α.

Te podejścia są równoważne. W niektórych tekstach dotyczących statystyk stosuje się metodę wartości P; w innych wykorzystuje się metodę regionów akceptacji. Na tej stronie internetowej mamy tendencję do stosowania podejścia opartego na akceptacji regionu.

Testy jedno- i dwukierunkowe

Badanie teorii faktograficznej, w której miejsce zwolnienia znajduje się tylko po jednej stronie badanego rozproszenia, znane jest jako badanie jednoetapowe. Na przykład, załóżmy, że nieważna teoria wyraża, że średnia nie jest dokładnie równa lub równa 10. Spekuluje się, że środek jest bardziej widoczny niż 10. Obszar zwolnienia obejmowałby zakres numerów znajdujących się po właściwej stronie kontrolnego rozpowszechniania, czyli dużo numerów bardziej godnych uwagi niż 10.

Próba wymiernej spekulacji, w której miejsce zwolnienia znajduje się po obu stronach dyspersji kontrolnej, nazywana jest próbą dwukierunkową. Na przykład, załóżmy, że nieważna teoria wyraża, że średnia jest równoważna 10. Spekuluje się, że średnia jest poniżej 10 lub więcej warta uwagi niż 10. Obszar zwalniania obejmowałby zakres numerów znajdujących się po obu stronach kontrolnego rozpowszechniania, to znaczy obszar zwalniania obejmowałby głównie numery poniżej 10 i niekompletnie numery bardziej godne uwagi niż 10.