Analiza statystyczna jest nauką o gromadzeniu danych oraz odkrywaniu wzorców i trendów. W rzeczywistości jest to po prostu inny sposób na określenie “statystyki”. Po zebraniu danych możliwa jest ich analiza:

Podsumować dane. Na przykład, zrobić wykres kołowy.

Znajdź kluczowe pomiary pozycji. Na przykład, średnia mówi, jaka jest średnia liczba (lub “średnia”) w zbiorze danych.

Obliczyć średnią z pomiarów pośredniczących: Dzięki nim dowiesz się, czy Twoje dane są ściśle pogrupowane, czy też są bardziej rozpowszechnione. Odchylenie standardowe jest jednym z najczęściej używanych pomiarów dyfuzyjnych; mówi ono o tym, jak szeroko zakrojone są dane na średnią.

Prognozuj przyszłość w oparciu o zachowania z przeszłości. Jest to szczególnie przydatne w handlu detalicznym, produkcji, bankowości, sporcie lub każdej organizacji, gdzie znajomość przyszłych trendów byłaby zaletą.

Sprawdź hipotezę eksperymentu. Zebranie danych z eksperymentu opowiada historię tylko wtedy, gdy analizujesz dane. Ta część analizy statystycznej jest bardziej formalnie nazywana “Testowaniem Hipotezy”, gdzie hipoteza zerowa (powszechnie przyjęta teoria) jest udowodniona lub obalona.

Analiza statystyczna i metoda naukowa

Analiza statystyczna jest szeroko stosowana w nauce, od fizyki do nauk społecznych. Poza testowaniem hipotez, statystyka może dostarczyć przybliżonych danych dla nieznanej, która jest trudna lub niemożliwa do zmierzenia. Na przykład, dziedzina kwantowej teorii pola, zapewniając sukces od strony teoretycznej, okazała się trudna do eksperymentowania i pomiarów empirycznych. Niektóre tematy nauk społecznych, takie jak badanie świadomości lub wyboru, są praktycznie niemożliwe do zmierzenia; analiza statystyczna może rzucić światło na to, co byłoby bardziej lub mniej prawdopodobnym scenariuszem.

Kiedy statystyki leżą

O ile statystyka może wydawać się solidną podstawą do wyciągania wniosków i przedstawiania “faktów”, o tyle ostrożni wobec pułapek analizy statystycznej. Obejmują one celową i przypadkową manipulację wynikami. Czasami jednak statystyki są po prostu błędne. Słynnym przykładem “po prostu błędnych” statystyk jest Paradoks Simpsona, który pokazuje nam, że nawet najlepsze statystyki mogą być całkowicie bezużyteczne. W klasycznym przypadku Simpsona, średnie przyjęć na Uniwersytet w Berkeley (poprawnie) wykazały, że ich średni wskaźnik przyjęcia był wyższy dla kobiet niż dla mężczyzn, podczas gdy w rzeczywistości było odwrotnie. Bardziej szczegółowe wyjaśnienie tej zagadki znajduje się w Paradoksie Simpsona.