Ponieważ zbiory danych drastycznie rosną, rozwijamy umiejętności, aby poprawić sposób, w jaki trenujemy głębokie sieci neuronowe. Pomaga to naukowcom mapować dane wejściowe i wyjściowe podczas etykietowania ogromnych ilości danych. Dane te obejmują przewidywania etykiet, zdania, obrazy itp.
Nadal nie jesteśmy w stanie uogólnić różnic między warunkami, które pomagają trenować dane. Umożliwienie modelowi wykonywania takich czynności w rzeczywistym świecie może być żmudnym zadaniem. Ponieważ w modelu pojawia się wiele nowych i nieporządanych sytuacji, napotka on problemy, na które dane treningowe nie są przygotowane.
Algorytm musi dokonać nowych przewidywań, aby rozwiązać skomplikowane i realne sytuacje. W tym artykule omówimy, jak przenieść dane do nowych warunków. Ten blog pozwoli zrozumieć, jak modele mogą zaadoptować uczenie transferowe i rozwinąć udany i rozbudowany model uczenia nadzorowanego.
Zrozumienie uczenia transferowego
Uczenie transferowe nie jest nowym podejściem w głębokim uczeniu. Chociaż różni się od tradycyjnej metody tworzenia i szkolenia modeli uczenia maszynowego, aby podążać za metodą transferu danych, istnieje wiele podobieństw. Główne korzenie tradycyjnych metod są specyficzne dla szkolenia, zbiorów danych i zadań opartych na izolowanych modelach.
Model nie zawiera żadnej wiedzy, którą zachowuje z innych modeli. W przypadku przenoszenia uczenia się, można kontrolować zestawy danych szkoleniowych w nowych modelach i radzić sobie z problemami takimi jak wykonywanie nowych zadań z mniejszą ilością danych.
Możesz zrozumieć to podejście na przykładzie. Załóżmy, że chcemy zidentyfikować różne obiekty w ograniczonej domenie firmy zajmującej się handlem elektronicznym. Załóżmy, że wykonujesz zadanie 1 jako T1. Następnie dostarczysz model różnych zbiorów danych i dostroisz je, aby wykonać niewidziane punkty danych z tego samego punktu danych e-commerce lub domeny.
Tradycyjny algorytm uczenia maszynowego rozbija zadania w danych domenach, jeśli dane nie są wystarczające. Powiedzmy, że model wykrywa niektóre zdjęcia elementów odzieży dla witryny e-commerce. To może być zadanie 2 lub T2. Idealnie byłoby móc użyć zbioru danych lub zdjęć z jednego wytrenowanego modelu T1 do innego T2. Ale nie spotykamy się z podobną sytuacją i nie udaje nam się zwiększyć wydajności modelu. Ma to wiele celów, takich jak dostosowanie modelu do trenowania domeny.
W przypadku uczenia transferowego, powinniśmy być w stanie wykorzystać dane z jednego wytrenowanego modelu do nowych, powiązanych z nim. Jeśli mamy więcej danych w zadaniu T1, możemy wykorzystać wiedzę taką jak kolor i rozmiar koszuli do modelu, który ma mniejszą wiedzę, czyli T2. Kiedy pojawia się problem w dziedzinie widzenia komputerowego, można przenieść cechy do różnych zadań i zwiększyć wiedzę. W prostych słowach, można wykorzystać wiedzę z jednego zadania jako dane wejściowe dla drugiego, aby wykonać nowe zadania.
Strategie uczenia się przez przeniesienie
Uczenie transferowe posiada wiele technik i strategii uczenia się, które możesz zastosować w swoich projektach w zależności od dziedziny, dostępnych danych i zadań. Poniżej znajdziesz niektóre z tych strategii i technik:
1. Uczenie bez nadzoru
Domena docelowa i źródła są podobne, natomiast zadania i czynności są różne. W tym przypadku, etykietowane dane nie są dostępne w żadnej domenie. Indukcyjne i nienadzorowane techniki są podobne dla domeny docelowej.
2. Transdukcyjne uczenie się przez przeniesienie
W tym warunku, zadania docelowe i źródłowe są podobne, ale istnieją różnice w powiązanych domenach. W domenie źródłowej jest dużo etykietowanych danych, podczas gdy w domenie docelowej nie ma żadnych danych. Można je sklasyfikować na różne podkategorie, odnoszące się do odmiennych ustawień.
3. Indukcyjne uczenie się przez przeniesienie
Domeny docelowa i źródłowa są takie same, ale ich zadania są różne. Algorytmy wykorzystują indukcyjne uprzedzenia domeny źródłowej i pomagają w poprawie zadania docelowego. Można podzielić etykietowane dane na dwie kategorie uczenie samodzielne i uczenie wielozadaniowe.
Uczenie transferowe dla głębokiego uczenia się
Wszystkie powyższe strategie są ogólnymi podejściami, które możemy zastosować w modelu uczenia maszynowego. To rodzi różne pytania, takie jak “czy możemy zastosować uczenie transferowe w kontekście głębokiego uczenia?”. Modele głębokiego uczenia pomagają z modelami uczenia indukcyjnego. Algorytm uczenia indukcyjnego może pomóc w mapowaniu przykładów szkoleniowych.
Na przykład, model będzie uczył się mapowania poprzez klasyfikację etykiet klas i cech wejściowych. Tego typu modele uczenia się generalizują niewidziane dane. Ponadto, algorytm będzie działał zgodnie z założeniami, w zależności od rozkładu danych szkoleniowych.
Eksperci nazywają te założenia założeniami indukcyjnymi (inductive bias). Za pomocą indukcyjnych założeń lub uprzedzeń, można scharakteryzować wiele czynników. Na przykład, przestrzeń hipotez ogranicza proces wyszukiwania, a to będzie miało duży wpływ na proces uczenia się modelu w oparciu o daną domenę i zadanie.
Wnioski
Podsumowując, można stwierdzić, że liczne kierunki badawcze przenoszą oferty uczenia się. Wiele aplikacji, które pomagają w transferze wiedzy, potrzebuje modeli do zaadoptowania nowych zadań w nowych domenach.