Nauka maszynowa staje się coraz bardziej wyrafinowana. Tak bardzo, że może ono również pomóc w podejmowaniu decyzji. Drzewo decyzyjne to zasadniczo układ różnych wyników związanych z serią powiązanych ze sobą wyborów. Organizacje i osoby indywidualne mogą wykorzystywać je do ważenia swoich działań w oparciu o wiele czynników, takich jak korzyści, prawdopodobieństwa i koszty. Drzewo decyzyjne w pytonie można wykorzystać do mapowania algorytmów przewidujących najkorzystniejszy wybór lub do prowadzenia nieformalnych dyskusji.

Osoby zajmujące się wydobyciem danych dość często korzystają z tego narzędzia, aby opracować strategie osiągania różnych celów. Jednak okazuje się, że maszynowe uczenie się jest tam, gdzie użycie drzewa decyzyjnego jest bardziej powszechne. Zazwyczaj drzewo decyzyjne zaczyna się od jednego węzła. Może on rozgałęziać się na wiele wyników. Każdy wynik prowadzi do dodania węzłów, które rozgałęziają się na więcej możliwości, nadając mu kształt podobny do drzewa.

Czym są różne węzły drzewa decyzyjnego?

Drzewo decyzyjne składa się z trzech typów węzłów: węzłów decyzyjnych, węzłów końcowych i węzłów przypadkowych. Węzły losowe reprezentują okrąg – podkreślają prawdopodobieństwo konkretnego wyniku. Kwadratowy kształt reprezentuje węzeł decyzyjny – wskazuje na wybór, którego musisz dokonać. Na koniec, węzeł końcowy reprezentuje wynik decyzji.

Related image

Analiza Przykład drzewa decyzyjnego

Możesz zmniejszyć ryzyko i zmaksymalizować szanse na osiągnięcie pożądanych rezultatów, obliczając przewidywaną wartość lub użyteczność każdego wyboru na drzewie. Jeśli chcesz obliczyć oczekiwaną użyteczność danego wyboru, odejmij ten koszt decyzji od oczekiwanych korzyści. Oczekiwane korzyści są proporcjonalne do ogólnej wartości każdego wyniku, który może wystąpić z danej opcji.

Kiedy próbujesz znaleźć pożądany rezultat, ważne jest, aby wziąć pod uwagę preferencje osoby podejmującej decyzję dotyczące użyteczności. Na przykład, niektórzy są gotowi podjąć ryzyko, aby uzyskać znaczne korzyści, podczas gdy inni chcą podjąć najmniejsze ryzyko.

Tak więc, gdy używasz drzewa decyzyjnego z jego modelem prawdopodobieństwa, może ono być przydatne do obliczania warunkowego prawdopodobieństwa zdarzenia. Mo “e równie” by¢ idealny do okre “lania, czy b¦dzie on oparty na innych zdarzeniach. Dlatego musisz zacząć od początkowej parzystości i podążać jego ścieżką do docelowego zdarzenia. Następnie pomnóż razem prawdopodobieństwo każdego zdarzenia, aby otrzymać wyniki.

W takich przypadkach możesz użyć drzewa decyzyjnego w postaci konwencjonalnego schematu drzewa, który mapuje prawdopodobieństwo różnych zdarzeń, takich jak dwukrotne przetoczenie kostki.

Zrozumienie Algorytmu Drzewa Decyzyjnego

Algorytm drzewa decyzyjnego w pythonie należy do grupy nadzorowanych algorytmów. Ponadto, w przeciwieństwie do większości nadzorowanych algorytmów uczenia się, algorytm drzewa decyzyjnego może być używany do rozwiązywania problemów klasyfikacji i regresji.

Po raz kolejny, podstawowym celem drzewa decyzyjnego przy opracowywaniu modelu treningu jest przewidywanie wartości lub klasy celu poprzez zrozumienie podstawowych reguł decyzyjnych zaczerpniętych ze starszych danych, które programiści nazywają również danymi treningowymi.

Zacznij od korzenia drzewa, gdy próbujesz przewidzieć etykietę klasy rekordu i porównaj wartość korzenia atrybutu z charakterystyką rekordu. Jeśli chodzi o porównanie, postępuj zgodnie z gałęzią odpowiadającą jego wartości, po czym możesz przejść do drugiego węzła.

Ile jest rodzajów drzew decyzyjnych?

Typy drzew decyzyjnych zależą od zmiennych docelowych. Istnieją dwa rodzaje drzew decyzyjnych:

  • Drzewo decyzyjne o zmiennej ciągłej
  • Drzewo decyzyjne o zmiennej kategorii

Na przykład, musimy przewidzieć, czy ktoś zwróci składkę na odnowienie za pośrednictwem firmy ubezpieczeniowej. W tym scenariuszu wiemy, że dochód klienta jest ogromną zmienną.

Jednak usługa ubezpieczeniowa nie posiada wszystkich szczegółów dotyczących klienta. Większość z Państwa będzie wiedziała, że ta zmienna jest krytyczna. Dlatego też możemy opracować drzewo decyzyjne do przewidywania dochodów klienta poprzez inne zmienne, takie jak produkty i zawód. W większości przypadków będziemy spekulować wartościami dla zmiennych ciągłych.

Jakie są plusy i minusy drzewa decyzyjnego?

Mocne strony

  • Drzewa decyzyjne oferują jasne wyobrażenie o krytycznych polach do klasyfikacji lub przewidywania
  • Drzewo decyzyjne jest zdolne do obsługiwania zmiennych kategorycznych i ciągłych
  • Nie wymagają one nadmiernych obliczeń przy dokonywaniu klasyfikacji
  • Drzewa te mogą generować łatwo zrozumiałe zasady

Słabe strony

  • Błędy są dość powszechne w drzewach decyzyjnych, szczególnie jeśli chodzi o problemy z klasyfikacją i przykłady szkoleń
  • Drzewa decyzyjne nie są idealnym rozwiązaniem w przypadku tworzenia zadań szacunkowych do przewidywania wartości ciągłego atrybutu
    Szkolenie drzewa decyzyjnego może być dość kosztowne obliczeniowo.
  • Musisz posortować pole plucia każdego kandydata na węzeł, aby określić najbardziej korzystny podział. Niektóre algorytmy wykorzystują kombinacje, które wymagają kompleksowego wyszukiwania w celu określenia odpowiednich wag łączących.
  • Przycinanie algorytmów jest dość kosztowne, głównie dlatego, że trzeba porównywać i formować podrzędy.

Podstawowa terminologia drzew decyzyjnych

Węzły dziecięce i rodzicielskie

Każdy węzeł, który dzieli się na podwęzły jest również znany jako węzeł nadrzędny. Węzły podrzędne są natomiast węzłami dziecięcymi.

Drzewo podrzędne/oddział

Podsekcja drzewa decyzyjnego to jego poddrzewo lub gałąź.

Przycinanie

Przycinanie jest procesem, w którym redukujesz rozmiar drzewa decyzyjnego poprzez oskubywanie jego węzłów.

Węzeł terminala / liść

Węzły Leaf lub Terminal nie mają dzieci i nie przechodzą przez dodatkowe podziały.

Węzeł decyzyjny

Gdy jeden podwęzeł dzieli się na wiele węzłów, staje się on węzłem decyzyjnym.

Podział na

Podział jest procesem, który dzieli jeden węzeł na wiele podwęzłów.

Węzeł bazowy

Węzeł korzeniowy reprezentuje całą próbę lub populację każdego węzła. Dzieli się on dalej na wiele jednorodnych zbiorów.

Myśli końcowe

Opracowanie drzewa decyzyjnego w pytonie może rozwiązać wiele kwestii związanych z decyzjami dla dużych i mniejszych organizacji. Może również pomóc jednostkom zdecydować, czy wybór, którego mają zamiar dokonać, będzie opłacalny. Deweloperzy często korzystają z biblioteki sclearnowej pythona, aby stworzyć drzewo decyzyjne sclearn. Jego implementacja i algorytm są bardziej wydajne i dają lepsze wyniki.