Prawdopodobieństwo zaczyna się od zwierzęcia i decyduje o tym, jakie ślady zrobi.

Statystyki widzą ślad stopy i zgadują, że to zwierzę.

Prawdopodobieństwo jest proste: masz niedźwiedzia. Zmierz rozmiar stopy, długość nogi, a wydedukujesz odciski stóp. “Pan Bubbles waży 400 funtów i ma 3-metrowe nogi, i może robić takie ślady.” Bardziej akademicko: “Mamy dobrą monetę. Po 10 rzutach, oto możliwe wyniki.”

Statystyka jest trudniejsza. Mierzymy odciski stóp i musimy zgadnąć, jakie to może być zwierzę. Niedźwiedź? Człowiek? Jeśli dostaniemy 6 głów i 4 ogony, jakie są szanse na dobrą monetę?

Zwykli Podejrzani

Oto jak “znajdziemy zwierzę” ze statystykami:

Zdobądźcie ślady. Każdy kawałek wiedzy może być punktem w “połącz kropki”. Im więcej danych, tym bardziej przejrzysta jest forma (1 punkt w “connect-the-dots” nie jest pomocny. Jeden punkt danych utrudnia wyszukiwanie trendów).

Zmierzyć istotne cechy. Każdy punkt bazowy posiada głębokość, szerokość i wysokość. Każdy zestaw danych charakteryzuje się średnią, medianą, wariancją itd. Te uniwersalne, ogólne opisy zapewniają przybliżone zwężenie: “Odcisk stopy ma 6 cali szerokości: mały niedźwiedź, czy duży człowiek?”

Znajdź gatunek. Istnieją dziesiątki możliwych zwierząt (rozkładów prawdopodobieństwa) do przemyślenia . Zawężamy je po uprzednim poznaniu systemu. w lesie? Myślisz o koniach, nie zebrach. radzisz sobie z pytaniami tak/nie? Rozważmy rozkład Bernoulliego. . .

Spójrzcie na dokładne zwierzę. Kiedy już będziemy mieli rozkład (“niedźwiedzie”), rzucamy okiem na nasze ogólne pomiary w tabeli. “Szeroki na 6 cali, głęboki na 2 cale odcisk łapy to prawdopodobnie 3-letni, 400-cio funtowy niedźwiedź”. Stół wyszukiwania jest generowany na podstawie rozkładu prawdopodobieństwa, tzn. wykonywania pomiarów, gdy zwierzę znajduje się w zoo.

Wykonaj dodatkowe przewidywania. Kiedy już wszyscy poznamy zwierzę, będziemy przewidywać jego przyszłe zachowanie i inne cechy (“Według naszych obliczeń, Pan Bąbelki zrobi kupę w lesie.”). Statystyki pomagają nam uzyskać informacje o pochodzeniu informacji, z samej informacji.

Ok! Metafora nie jest idealna, ale bardziej smakowita niż “Statystyka jest tym, że badanie gromadzenia, organizacji, analizy i interpretacji danych”. Potrzebujesz dowodu? sprawdźmy, czy będziemy zadawać intuicyjne pytania “Spróbowałem tego!”:

Jakie są najbardziej powszechne gatunki? (Wspólne rozmieszczenie)

Czy odkrywa się nowe?

Czy możemy przewidzieć kolejne ślady? (Extrapolacja)

Czy tory podążają szlakiem? (Regresja / linia trendu)

Oto dwa tory. Które zwierzę było szybsze? Większym? (Dane z dwóch prób z lekami: które było bardziej skuteczne?)

Czy jeden zawód zwierzęcia jest równoważny z drugim? (Korelacja)

Czy dwa zwierzęta to standardowe źródło? (Przyczyna: dwa niedźwiedzie goniące za równoważnym królikiem)