Jako naukowiec zajmujący się danymi, powinieneś zrozumieć właściwe techniki interpretacji mechanizmu działania modelu. Interpretacja jest istotnym aspektem nauki o danych. Za każdym razem, gdy tworzysz model z dokładnymi i imponującymi wynikami, powinieneś wiedzieć, jak działa jego mechanizm. Wiele osób generuje model poprzez kodowanie, ale nie ma pojęcia, jak kody tworzą model i sprawiają, że działa.

Na przykład, budujesz model, który pomoże Ci przewidzieć ceny akcji. Zauważyłeś, że ceny akcji nienormalnie rosną z dnia na dzień. Może się to zdarzyć z wielu powodów. Dlatego możesz użyć Maximum Likelihood Estimation, aby znaleźć prawdopodobieństwo wystąpienia problemu z najwyższym prawdopodobieństwem. Wielu specjalistów z różnych dziedzin wykorzystuje to narzędzie do obrazowania satelitarnego, MRI i wielu innych.
W tym poradniku dowiesz się, jak dogłębnie poznać Maximum Likelihood Estimation i jak możesz zaimplementować to narzędzie do swojego modelu. Zaczynajmy więc.

Maksymalna estymacja prawdopodobieństwa (Maximum Likelihood Estimation)

Estymacja największego prawdopodobieństwa jest metodą dostarczającą statystycznych rozwiązań problemów związanych z modelem uczenia maszynowego. Daje ona możliwość ustawienia parametrów i maksymalizacji estymacji prawdopodobieństwa. Dzięki tej technice można założyć, że dane wyjściowe modelu wynikają z obserwowanych danych. Powyższa definicja estymacji maksymalnego prawdopodobieństwa oznacza, że aby stworzyć model, powinniśmy:
1. Przygotować model, który obejmuje dane. Model można nazwać procesem generującym dane.
2. Umieć uzyskać dane z modelu i wyznaczyć funkcję prawdopodobieństwa.
Po uzyskaniu funkcji prawdopodobieństwa, zdasz sobie sprawę, że maksymalne prawdopodobieństwo jest prostym problemem optymalizacyjnym.

Związek z uczeniem maszynowym

Zastosowane uczenie maszynowe i problemy estymacji gęstości bezpośrednio łączą się ze sobą. Możliwe jest ujęcie problemów związanych z modelem uczenia maszynowego jako estymacji gęstości prawdopodobieństwa. Wybierając model i jego parametry, należy odnieść się do hipotezy modelującej h i problemów ze znalezieniem h, które lepiej wyjaśnia dane X.
– P(X; h)
Teraz, aby zmaksymalizować funkcję prawdopodobieństwa, musimy zidentyfikować hipotezę modelującą.
– maksymalizuj L(X; h)
Lub, możemy to rozwinąć jako:
– maksymalizuj sumę i do n log(P(xi ; h))
W konsekwencji pozwoli to na oszacowanie gęstości prawdopodobieństwa zbioru danych. Technika ta jest najczęściej używana w modelach uczenia maszynowego bez nadzoru. Możesz użyć Maximum Likelihood Estimation dla algorytmów klasteryzacji.

Maksymalna estymacja prawdopodobieństwa i algorytmy klasteryzacji

Maksymalne oszacowanie prawdopodobieństwa można efektywnie wykorzystać w nadzorowanych modelach uczenia maszynowego. Możemy zastosować tę metodę dla danych, które zawierają zmienne wejściowe i wyjściowe. Zmienne wyjściowe będą wartościami liczbowymi, a klasyfikacja i modelowanie regresji predykcyjnej będzie zawierało etykietę klasy.
Maximum Likelihood Estimate to warunkowe prawdopodobieństwo oszacowane na podstawie danych wyjściowych (y), podczas gdy dane wejściowe to (X), a hipoteza modelująca to (h).
– maksymalizuj L(y|X; h)
Lub, możemy to rozwinąć jako:
– maksymalizuj sumę i do n log(P(yi|xi ; h))
Gdy naszym celem jest przewidywanie y w zależności od x, możemy użyć estymatora maksymalnej wiarygodności i oszacować prawdopodobieństwo warunkowe przez:
P(y|x ; theta)
Większość modeli nadzorowanych opiera się na tej technice estymacji, co sprawia, że jest to powszechna sytuacja. Oznacza to, że Maximum Likelihood Estimation pomoże w estymacji gęstości i znalezieniu nadzorowanego modelu i jego parametrów. Dlatego technika ta działa jako fundament techniki modelowania liniowego, takich jak:
– Regresja logistyczna, która pomaga w klasyfikacji binarnej
– Regresja liniowa, która pomaga przewidzieć wartość liczbową.
W regresji logistycznej model oddziela klasy poprzez uwzględnienie zestawów współczynników, definiując je jako linię. Nie można rozwiązać tego problemu analitycznie, ale poprzez wykorzystanie wydajnego algorytmu optymalizacyjnego. Przykładem może być algorytm BFGS lub jego warianty.
Gdy rozważamy regresję liniową, model będzie zawierał zestawy współczynników definiujących go jako linię. Możesz rozwiązać ten problem za pomocą rozwiązań analitycznych, takich jak użycie algebry liniowej.
Główną zaletą estymacji maksymalnej wiarygodności w uczeniu maszynowym jest to, że poprawia ona jakość modelu poprzez zwiększenie rozmiaru zbioru danych i jakości estymatora.

Jak zaimplementować estymację największej wiarygodności w Pythonie?

Możesz uprościć ten proces, implementując estymację największej wiarygodności w swoim projekcie uczenia maszynowego. Aby to osiągnąć, można użyć wielu technik matematycznych i podejść. Poniżej przedstawiamy jedno z podejść do zaprogramowania modelu do estymacji maksymalnej wiarygodności

Krok 1: Importowanie bibliotek do modelu

Zaimportuj wszystkie poniższe biblioteki do modelu:
import NumPy jako np.

Zaimportuj pandas jako PD
zaimportuj matplotlib pyplot jako plt
zaimportuj seaborn jako sns
from scipy.optimize import minimize
zaimportuj scipy.stats jako stats

zaimportuj pymc3 jako pm3
zaimportuj numdifftools jako ndt
zaimportuj statsmodels.api jako sm
Teraz zaimportuj GenericLikelihoodModel z statsmodels.base.model

Krok 2: Generowanie danych

N = 1000
x = np.linspace(0,200,N)
e = np.random.normal(loc = 0.0, scale = 5.0, size = N)
y = 3*x + e

df = pd.DataFrame({‘y’:y, ‘x’:x})
df[‘constant’] = 1

Krok 3: Wizualizacja wykresu

Użyj następującego kodu referencyjnego do wykreślenia wykresu:
sns.regplot(df.x, df.y)

Krok 4: Analiza danych

Możesz przeanalizować dane przez następujące wykreślanie danych z linią OLS i przedziałami ufności

Krok 5: Modelowanie OLS przy użyciu Statsmodels

Ponieważ utworzona regresja to dane ciągłe, możesz obliczyć log-likelihood i współczynniki używając sm.OLS.
Podziel cechy i cel
X = df[[‘constant’, ‘x’]]
Dopasuj model i podsumuj
sm.OLS(y,X).fit().summary()

Wnioski

Estymacja największej wiarygodności jest unikalną i użyteczną techniką, która pomaga oszacować parametry zbioru danych lub rozkładu na podstawie zbioru danych. Możesz użyć tego narzędzia dla ograniczonej próbki populacji lub zidentyfikować wartości średniej i wariancji. W powyższym poradniku rozumiemy, czym jest estymacja największej wiarygodności i jak można zaimplementować tę technikę na modelu uczenia maszynowego.