Zrozumienie Lasów Przypadkowych
Lasy losowe są maszynową metodą uczenia się algorytmów klasyfikacyjnych. Obejmuje ona kilka indywidualnych drzew decyzyjnych, które opierają się na cechach losowych i szkoleniu w zakresie danych w celu osiągnięcia inteligentnego zgadywania, które ma większą wiarygodność niż pojedyncze drzewo decyzyjne. Wszystkie drzewa decyzyjne w lesie losowym są oddzielnymi modelami. Każde z nich wykorzystuje podzbiór cech losowych do przewidywania celu, a wszystkie te przewidywane cele kumulują się razem, aby przewidzieć bardziej dokładny cel.
Wychodząc od drzew decyzyjnych
Biorąc pod uwagę, że nie każdy czytający to może być świadomy żargonu maszynowego, zdecydowaliśmy się podzielić pojęcia na laickie terminy. Każdy świadomie lub nieświadomie korzystał z drzew decyzyjnych zarówno w latach akademickich, jak i w życiu zawodowym. Koncepcja ta jest jak schemat blokowy, w którym skomplikowane dane lub tekst rozkłada się na proste kroki w formie schematu blokowego.
Chociaż w schemacie decyzyjnym rzeczy nie są tak proste i jednostronne, jak w schemacie blokowym, w schemacie decyzyjnym zaczyna się od części początkowej i tworzy węzły między zmiennymi aż do osiągnięcia celu. Na przykład, ktoś chce, abyś przewidział rangę swojej ulubionej drużyny piłkarskiej w nadchodzącym turnieju. Tutaj zaczniesz od początkowego prawdopodobieństwa. Ale to początkowe prawdopodobieństwo nie może być absolutną odpowiedzią, szczególnie gdy w procesie przewidywania występują tendencje stronnicze.
Będziesz musiał podać powody i skruszyć liczby, aby twoje przypuszczenia były jak najbardziej wiarygodne.
Pierwsza zmienno±¢ wynika z twojego pytania, które pomoże ci zdecydować jak osi¡±gn±¢ cel. Każde pytanie, które zadasz, będzie tworzyło wariant, po którym pojawi się trasa “tak lub nie” albo “prawda lub fałsz”, która ostatecznie doda gałąź do drzewa decyzyjnego. Za każdym razem, gdy wybierzesz trasę, będziesz musiał ustalić związek pomiędzy wiedzą, którą zdobyłeś przed tym punktem. W pewnym sensie wszystko zależy od Twojej zdolności do zadawania pytań, które pomogą Ci zdobyć najbardziej odpowiednią wiedzę, aby osiągnąć pożądany cel.
Korelacja pomiędzy Drzewem Decyzyjnym a Lasem Przypadkowym
Jak wspomniano wcześniej, lasy losowe są zgromadzeniem kilku pojedynczych drzew decyzyjnych. Wszystkie drzewa decyzyjne, które są jego częścią, używają różnych zmiennych z tego samego zestawu danych, choć wszystkie osiągają pożądany cel różnymi środkami. Wiarygodność tych lasów opiera się na fakcie, że żadne dwie osoby nie mogą osiągnąć celu przy użyciu tej samej drogi lub rozumowania. I nawet jeśli niektóre są podobne, zawsze można wykorzystać te powtarzające się wzorce w lesie w celu wyeliminowania prób i błędów.
Na przykład, analityk sportowy, były piłkarz, dziennikarz sportowy, entuzjastyczny kibic i emerytowany sędzia zadadzą inne pytanie, aby przewidzieć wynik meczu. Wszyscy oni mają różne umiejętności, informacje i wiedzę na temat gry, dlatego ich metody osiągania celu przewidywania będą się różnić. Inaczej wygląda nie tylko ich gra w wiedzę, ale także ich rozumowanie w celu ustalenia związku pomiędzy zmiennymi uzyskanymi z ich danych.
Teraz drzewa decyzyjne wszystkich tych osób stworzą model. Wspólnie, model ten jest “przypadkowym lasem”. Masz te wszystkie indywidualne przewidywania z kilku niepowiązanych ze sobą drzew decyzyjnych, a wszystkie one użyły unikalnych sposobów przewidywania pożądanego celu. Możesz użyć tych wszystkich przewidywań, aby zwiększyć dokładność swojej ostatecznej prognozy.
Jak to działa
Tworzenie losowego lasu to nie tylko kwestia tworzenia drastycznie przeciwstawnych zmiennych czy wybierania losowych cech z dostępnych danych. Musisz mieć zmysł do mapowania danych i talent do zadawania rozsądnych pytań, aby móc dokładnie zgadywać. Maszyny mogą się tego nauczyć, przechowując informacje, którymi karmisz je przez lata, ale nadal nie będą w stanie zadawać przełomowych pytań, które człowiek postawiłby w obliczu ślepego zaułka w drzewie decyzyjnym.
Aby przypadkowy las mógł działać, musisz zebrać kilka drzew decyzyjnych. Wszystkie te drzewa będą korzystać z losowych danych szkoleniowych, które pomogą w ustaleniu cech. Wiedz, że cechy są relacjami, które klasyfikator buduje pomiędzy danymi w procesie uczenia maszynowego, a tym, co chcemy przewidzieć, jest cel.
Zalety
Poniżej przedstawiamy kilka zalet przypadkowego lasu:
Losowy las zwiększa dokładność przewidywania
Korzystasz z mądrości tłumu zamiast jednej osoby lub maszyny
Żadna z decyzji dotyczących lasu nie jest ze sobą powiązana
Wniosek
Uczenie się maszynowe może mieć kilka skomplikowanych pojęć i terminów, które są nie do zrozumienia dla osób z zewnątrz, ale las losowy jest terminem bliskim jego pierwotnemu znaczeniu. Każde drzewo decyzyjne, które jest jego częścią, jest jego elementem konstrukcyjnym i działa jak gałązka drzewa. Wrzuć do jednego worka kilka drzew decyzyjnych razem, a będziesz miał w ręku jeden z najbardziej wiarygodnych i dokładnych algorytmów klasyfikacji predykcyjnej uczenia maszynowego znany jako losowy las.