W tym artykule dowiesz się o generatywnych sieciach przeciwstawnych (ang. Generative Adversarial Networks, GAN). Generative adversarial networks są generatywnym podejściem do modelowania dla technik głębokiego uczenia się. Ten przykład dla GANs obejmuje konwolucyjne sieci neuronowe.
Modelowanie generatywne jest zadaniem uczenia maszynowego dla uczenia bez nadzoru. Obejmuje ono uczenie się regularności, automatycznych odkryć lub wzorców jako danych wejściowych. W ten sposób model może używać nowych danych generatywnych do uczenia maszynowego, co wiąże się z automatycznym uczeniem się. Możesz wykorzystać wszystkie prawidłowości lub wzorce w danych wejściowych w sposób, który generuje nowe przykłady, które możesz wyciągnąć z oryginalnego zbioru danych.
Użyj GAN do szkolenia modelu generatywnego i kadrowania problemu dla uczenia nadzorowanego z dwoma submodelami.

– Model dyskryminacyjny

Model dyskryminacyjny klasyfikuje przykłady jako fałszywe (wygenerowane) lub prawdziwe (domena). Musisz wytrenować oba te modele razem w kontradyktoryjnej grze o sumie zerowej. Oznacza to, że model generatora generuje wiarygodne przykłady.

– Model generatora

Model generatywny jest używany do trenowania nowych przykładów.
Dziedziny GAN-ów szybko i ekscytująco zmieniają się w zakresie możliwości tworzenia rzeczywistych przykładów w różnych domenach. Jest to szczególnie, gdy zadania odnoszą się do obrazu, do tłumaczenia zdjęć, takich jak zima na lato lub noc na dzień. Pomaga to generować fotorealistyczne sceny, obiekty i ludzi, których nie rozpoznasz jako fałszywe. Ten artykuł pomoże Ci odkryć Generative Adversarial Networks lub GANs.

Co to jest GAN

GAN lub Generative Adversarial Network będzie działać jako architektura algorytmiczna przy użyciu dwóch sieci neuronowych. Obie sieci będą przeciwstawiać się sobie, aby wygenerować syntetyczne i nowe instancje danych, przechodząc prawdziwe dane. Można go używać do generowania wideo, rozpoznawania głosu i generowania obrazów. Potencjał GAN-ów może służyć zarówno złu, jak i dobru. Będą one dystrybuować dane i naśladować siebie nawzajem. Ich wydajność będzie niezwykła dla wszystkich dziedzin, takich jak mowa, muzyka, obrazy i proza.

Jak działają GAN-y

Istnieje sieć neuronowa, która pomaga w generowaniu nowych instancji danych. Eksperci nazywają tę sieć neuronową “generatorem”. Poprzez inną sieć neuronową, dyskryminator ocenia je pod względem autentyczności. Oznacza to, że dyskryminator zdecyduje, czy każda instancja danych, którą ocenia, należy do rzeczywistego zbioru danych szkoleniowych.
Załóżmy, że chcemy naśladować Mona Lisę. Będziemy generować ręcznie pisane cyfry, które można znaleźć w zbiorze danych MNIST otrzymanym z prawdziwego świata. Głównym celem dyskryminatora, podczas pokazywania instancji za pomocą prawdziwego zbioru danych MNIST, jest zidentyfikowanie tych autentycznych.
W międzyczasie generator będzie tworzył nowe, syntetyczne obrazy przekazywane do dyskryminatora. W ten sposób zostanie wygenerowany nowy obraz podobny do autentycznego, ale fałszywy. Generator będzie przekazywał odręcznie napisane cyfry jako cel kłamstwa, aby nie zostać złapanym. Dyskryminator zidentyfikuje obrazy, które pochodzą jako fałszywe z generatora. GAN może podjąć następujące kroki:
– Obrazy generowane przez generator będą podawane obok strumienia obrazów do generatora, które otrzymują ground-truth i rzeczywisty zbiór danych.
– Generator pobierze liczby losowe i zwróci obraz jako wyjście.
– Dyskryminator weźmie zarówno fałszywe jak i prawdziwe obrazy i zwróci prawdopodobieństwa. Na przykład, jeśli liczby są pomiędzy 1 a 0. 1 będzie reprezentować przewidywania jako autentyczne, a 0 będzie reprezentować fałszywe.
W ten sposób powstanie pętla z podwójnym sprzężeniem zwrotnym:
– Generator i dyskryminator będą w tej samej pętli sprzężenia zwrotnego.
– Dyskryminator będzie w pętli sprzężenia zwrotnego, a obrazy będą prawdą gruntową.
Aby zrozumieć GAN, możemy rozważyć policjanta i opozycję falsyfikatu w grze w mysz i kota. W grze, fałszerstwo nauczy się przekazywać fałszywe banknoty, a policjant nauczy się wykrywać te banknoty. Obie postacie będą dynamiczne. Na przykład, cały trening, który otrzyma policjant, będzie przenoszony na drugą postać w ciągłej eskalacji.
Sieć dyskryminacyjna jest standardową siecią konwencjonalną dla MNIST i będzie ona kategoryzować wszystkie obrazy, które otrzyma. Klasyfikator binominalny będzie oznaczał obrazy jako fałszywe lub prawdziwe. Z drugiej strony, generatorem będzie odwrotna sieć konwolucyjna. Standardowy klasyfikator konwencjonalny weźmie obraz, a on będzie downsample obraz-produkcja prawdopodobieństwa. Generator usunie próbkowanie losowego szumu po przyjęciu go jako wektor.
Model wyrzuci technikę downsamplingu jako pierwsze dane i wygeneruje nowe dane jako drugie, takie jak max-pooling. Obie sieci będą próbowały zoptymalizować różne i przeciwstawne dane jako funkcję straty lub funkcję celu w grze o sumie zerowej. Będzie to działać jak model aktora-krytyka. Gdy dyskryminator i generator zmienią zachowanie i vice versa, straty będą przeciwstawne.

Wnioski

Technika transformacji odwrotnej wygeneruje zmienne losowe, które będą podążać za danym rozkładem, czyniąc go jednolitym i zmiennym losowym. Przejdzie to przez elegancką funkcję transformacji. Ta metoda transformacji odwrotnej rozszerzy pojęcie metody transformacji. Ponadto, generuje zmienne losowe. Zmienne te będą rozwijać funkcje prostszych zmiennych losowych.