Algorytmy

Algorytmy uczenia się maszynowego w systemach rekomendacji są zazwyczaj podzielone na dwie kategorie – oparte na treściach i zorientowane na społeczność techniki przesiewania, choć dzisiejsi rekomendatorzy konsolidują te dwie metodyki. Strategie oparte na treści opierają się na szacunku do podobieństwa cech rzeczy, a techniki zorientowane na społeczność są zbliżone do siebie dzięki komunikacji. Poniżej omawiamy głównie strategie społecznościowe, które umożliwiają klientom znalezienie nowej substancji, a nie jak to miało miejsce wcześniej.

https://miro.medium.com/max/800/0*1tOjnxfUbtAQnhiO

Strategie zorientowane na społeczność współpracują z siecią komunikacyjną, którą można również nazwać siatką rankingową w nietypowej sytuacji, gdy klienci dokonują wyraźnej oceny rzeczy. Zadaniem sztucznej inteligencji jest zdobycie biegłości w zakresie zdolności przewidywania użyteczności rzeczy dla każdego klienta.

https://miro.medium.com/max/800/0*xl72u0bvb_j2hV2w

Matryca jest zazwyczaj ogromna, wyjątkowo skąpa, a większa część cech jest nieobecna.

Najprostsze dane obliczeniowe cosinusoidalne lub połączenia porównywalność linii (klientów) lub odcinków (rzeczy) i nakazuje rzeczy, które k – najbliżsi sąsiedzi docenione.

https://miro.medium.com/max/800/0*ZEaYcKjjV6RK-VfU

Strategie oparte na faktoryzacji sieciowej starają się zmniejszyć wymiarowość kraty asocjacyjnej i osłabić ją o co najmniej dwie małe ramy z k uśpionymi segmentami.

https://miro.medium.com/max/1392/0*1SFw18gXgdSRsa8N

Zwiększając porównanie linii i segmentu przewidujesz ocenę rzeczy przez klienta. Przygotowanie błędnej oceny można uzyskać poprzez porównanie nieważnych ocen z przewidywanymi ocenami. Podobnie można uregulować przygotowywanie nieszczęścia poprzez włączenie terminu “kara”, utrzymując oszacowania wektorów obojętnych na niskim poziomie.

https://miro.medium.com/max/800/0*LVoAqzjzlWw5xP2K

Najpopularniejszym algorytmem treningowym jest stochastyczne opadanie gradientowe minimalizujące straty poprzez aktualizacje gradientowe obu kolumn i wierszy macierzy p a q.

https://miro.medium.com/max/800/0*ZgnXVlPYBMqAIftC

https://miro.medium.com/max/800/0*ZgnXVlPYBMqAIftC

 

Alternatywnie, można użyć metody Alternating Least Squares, która iteracyjnie optymalizuje matrycę p i matrycę q poprzez ogólny krok najmniej kwadratów.

https://miro.medium.com/max/800/0*TFRAujsJuRjStL-z

Zasady przynależności mogą być również wykorzystane do sugestii. Rzeczy, które często są pożerane razem, są związane z krawędzią na wykresie. Można zobaczyć pęczki blockbusterów (grubo związane z rzeczami, z którymi prawie każdy się wiąże) oraz małe, odizolowane grupy o specjalnej zawartości.

https://miro.medium.com/max/800/0*Wr-AhFrT8h42Jctu

Zasady wydobyte z sieci współpracy powinny mieć prawdopodobnie nieznaczną pomoc i pewność. Wsparcie utożsamiane jest z powtarzalnością zdarzenia – konsekwencje trafień typu smash są bardzo pomocne. Duża pewność oznacza, że reguły nie są regularnie lekceważone.

https://miro.medium.com/max/800/0*H-Qh-QIY8hw7ueid

Zasady górnicze nie są do końca uniwersalne. Obliczenia APRIORI badają przestrzeń stanu możliwych ciągłych zestawów przedmiotów i pozbywają się części przestrzeni badawczej, która nie jest odwiedzana.

https://miro.medium.com/max/800/0*8UjC23xl142gNukr

Częste zestawy pozycji są wykorzystywane do generowania reguł i te reguły generują zalecenia.

https://miro.medium.com/max/800/0*h8RNPTnENwZ-ZNpR

Pokazujemy na przykład zasady wywodzące się z giełd bankowych w Republice Czeskiej. Huby (kooperacje) to terminale, a krawędzie to giełdy wizytowe. Możesz zasugerować terminale bankowe, które są w znacznym stopniu zależne od wcześniejszych wypłat/instalacji.

https://miro.medium.com/max/800/0*LYlF9eVIQbprtej5

Karanie rzeczy powszechnych i rozdzielanie zasad dotyczących długiego ogona za pomocą dolnego podgłówka skłania do fascynujących decyzji, które rozszerzają propozycje i pomagają znaleźć nowe treści.

https://miro.medium.com/max/800/0*Uc4pI9G1D8pHG67Q

Matryca ratingowa może być również pakowana przez system neuronowy. Rzekomy autokoder jest zasadniczo taki sam jak ramowa faktoryzacja. Głębokie autoenkodery, z różnymi ukrytymi warstwami i nieliniowościami, są tym bardziej dominujące, że trudniej je przygotować. Siatka neuronowa może być również wykorzystywana do wstępnego przetwarzania cech rzeczy, dzięki czemu możemy skonsolidować oparte na treści i społeczności rysuje blisko.

https://miro.medium.com/max/800/0*gpVx7bweodK0WYN1

W procesie głębokiego uczenia się zorientowanego na społeczność, przez cały czas szkolisz się w zakresie faktoryzacji siatki z wykorzystaniem autokoderów konsolidujących cechy rzeczy. Jest oczywiście o wiele więcej obliczeń, które można wykorzystać do sugestii, a poniższy fragment wstępu przedstawia kilka strategii zależnych od głębokiego i wspomagającego uczenia się.

https://miro.medium.com/max/800/0*iBB7UGxRVWAta0ri

Zalecenia mogą być oceniane odpowiednio jako tradycyjne modele grypy ptaków na podstawie informacji chronicznej (ocena odłączona).

https://miro.medium.com/max/800/0*JLNWaiyubDYXOkf3

Interakcje losowo wybranych użytkowników testowych są weryfikowane krzyżowo w celu oszacowania wydajności rekomendowanego urządzenia na niewidocznych wartościach znamionowych.

https://miro.medium.com/max/800/0*fumY8hRkzmo2XRjE

Średnia kwadratowa błędów podstawowych (RMSE) jest nadal szeroko stosowana, pomimo licznych badań wskazujących na to, że RMSE jest słabym estymatorem wykonania online.

https://miro.medium.com/max/800/0*B3Bjy-bAmzSG4VEE

Coraz bardziej realistyczną miarą oceny rozłącznej jest przegląd lub dokładność oceny poziomu dokładnie określonych rzeczy (z rzeczy sugerowanych lub ważnych). DCG myśli dodatkowo o pozycji oczekującej, że znaczenie rzeczy logarytmicznie zmniejszy się.

https://miro.medium.com/max/800/0*iqXm7CHrMGPTzhA4

Można użyć dodatkowego środka, który nie jest tak drażliwy dla nachylenia odłączonych informacji. Włączenie listy wraz z przeglądem lub dokładnością może być wykorzystane do poprawy wielu celów. Zapoznaliśmy się z parametrami regulującymi wszystkie obliczenia, które pozwalają kontrolować ich wszechstronność i karać propozycje prominentnych rzeczy.

https://miro.medium.com/max/800/0*9yp4yTlvBbO3kkvH

Zarówno przegląd, jak i włączenie powinny zostać rozszerzone, tak aby zachęcić rekomendatorów do przedstawiania precyzyjnych i zróżnicowanych propozycji uprawniających klientów do badania nowych treści.

https://miro.medium.com/max/800/0*Ij-5PRNLGHn7fhwf

Raz na jakiś czas brak jest współpracy. Pozycje zimnego startu lub klienci zimnego startu potrzebują więcej połączeń, aby wiarygodnie oszacować porównywalność ich współpracy, więc wspólne strategie rozdzielania zaniedbują tworzenie sugestii.

https://miro.medium.com/max/800/0*9LyXYcrx3yxxOMHG

Kwestie związane z zimnym startem można zmniejszyć, gdy weźmie się pod uwagę podobieństwo postaci. Możesz zakodować właściwości do wektora binarnego i podać go do rekomendowanego.

https://miro.medium.com/max/800/0*V4Q57_afG6VHP1rw

Rzeczy łączone w zależności od ich podobieństwa połączeń i podobieństwa własności są często regulowane.

https://miro.medium.com/max/800/0*9JtdaFfiSuJ7Uq3a