In diesem Artikel erfahren Sie mehr über generative adversarische Netzwerke oder GANs. Generative adversarische Netzwerke sind der generative Modellierungsansatz für Deep Learning-Techniken. Dieses Beispiel für GANs umfasst konvolutionale neuronale Netze.
Generative Modellierung ist eine maschinelle Lernaufgabe für unüberwachtes Lernen. Es beinhaltet das Lernen von Regelmäßigkeiten, automatischen Entdeckungen oder Mustern als Eingabedaten. Auf diese Weise kann das Modell neue generative Daten für das maschinelle Lernen verwenden, was ein automatisches Lernen beinhaltet. Sie können alle Regelmäßigkeiten oder Muster in den Eingabedaten so verwenden, dass neue Beispiele generiert werden, die Sie aus dem Originaldatensatz ziehen können.
Verwenden Sie GANs für das Training des generativen Modells und rahmen Sie das Problem für das überwachte Lernen mit zwei Teilmodellen.
– Diskriminator-Modell
Das Diskriminatormodell klassifiziert die Beispiele als unecht (generiert) oder echt (Domäne). Sie müssen diese beiden Modelle zusammen in einem kontradiktorischen Nullsummenspiel trainieren. Das bedeutet, dass das Generatormodell plausible Beispiele generiert.
– Generatorisches Modell
Wir verwenden das generative Modell zum Trainieren neuer Beispiele.
Der Bereich der GANs entwickelt sich rasant und aufregend in der Fähigkeit, reale Beispiele in verschiedenen Domänen zu erzeugen. Dies ist besonders dann der Fall, wenn sich die Aufgaben auf das Bild beziehen, auf Bild-Foto-Übersetzungen wie Winter zu Sommer oder Nacht zu Tag. Dies hilft dabei, fotorealistische Szenen, Objekte und Personen zu generieren, die Sie nicht als Fälschung erkennen werden. Dieser Artikel wird Ihnen helfen, die Generative Adversarial Networks oder GANs zu entdecken.
Was sind GANs?
Das GAN oder Generative Adversarial Network ist eine algorithmische Architektur, die zwei neuronale Netze verwendet. Die beiden Netzwerke stehen sich gegenüber, um synthetische und neue Dateninstanzen zu generieren, wobei die realen Daten übergangen werden. Sie können es für die Videogenerierung, die Spracherkennung und die Bilderzeugung verwenden. Das Potenzial von GANs kann sowohl dem Bösen als auch dem Guten dienen. Sie werden Daten verteilen und sich gegenseitig imitieren. Ihr Output wird für alle Domänen wie Sprache, Musik, Bilder und Prosa bemerkenswert sein.
Wie GANs funktionieren
Es gibt ein neuronales Netzwerk, das bei der Generierung der neuen Dateninstanzen hilft. Experten nennen dieses neuronale Netz “Generator”. Durch das andere neuronale Netz werden sie vom Diskriminator auf ihre Authentizität hin bewertet. Das bedeutet, dass der Diskriminator entscheidet, ob jede Dateninstanz, die er auswertet, zum tatsächlichen Trainingsdatensatz gehört.
Angenommen, wir wollen die Mona Lisa nachahmen. Wir werden handgeschriebene Ziffern generieren, die wir im MNIST-Datensatz aus der realen Welt gefunden haben. Das Hauptziel des Diskriminators ist es, während der Darstellung der Instanz mit Hilfe eines echten MNIST-Datensatzes die authentischen zu identifizieren.
In der Zwischenzeit erstellt der Generator neue und synthetische Bilder, die an den Diskriminator übergeben werden. Dadurch wird ein neues Bild erzeugt, das dem echten Bild ähnlich, aber gefälscht ist. Der Generator wird die handgeschriebenen Ziffern als Ziel übergeben, um zu lügen, ohne erwischt zu werden. Der Diskriminator identifiziert die Bilder, die als Fälschung vom Generator kommen. GAN kann die folgenden Schritte ausführen:
– Die vom Generator erzeugten Bilder werden zusammen mit dem Strom von Bildern in den Generator eingespeist, den die Grundwahrheit und der tatsächliche Datensatz erhalten.
– Der Generator nimmt die Zufallszahlen und gibt das Bild als Ausgabe zurück.
– Der Diskriminator nimmt sowohl die gefälschten als auch die echten Bilder und gibt die Wahrscheinlichkeiten zurück. Wenn die Zahlen z. B. zwischen 1 und 0 liegen, steht 1 für die Vorhersage als authentisch und 0 für die Fälschung.
Auf diese Weise erhalten Sie eine Schleife mit doppelter Rückkopplung:
– Der Generator und der Diskriminator befinden sich in der gleichen Rückkopplungsschleife.
– Der Diskriminator wird in der Rückkopplungsschleife sein, und die Bilder werden die Grundwahrheit sein.
Um das GAN zu verstehen, können wir uns den Polizisten und den Gegner einer Fälschung in einem Spiel von Maus und Katze vorstellen. In diesem Spiel lernt die Fälschung, die falschen Scheine weiterzugeben, und der Polizist lernt, diese Scheine zu erkennen. Beide Charaktere werden dynamisch sein. Zum Beispiel wird das gesamte Training, das der Polizist erhält, in einer ständigen Eskalation auf den anderen Charakter übertragen.
Das Diskriminator-Netzwerk ist das Standard-Faltungsnetzwerk für MNIST, und dieses wird alle Bilder, die es erhält, kategorisieren. Der binominale Klassifikator wird die Bilder als gefälscht oder echt kennzeichnen. Auf der anderen Seite wird der Generator das inverse Faltungsnetzwerk sein. Der Standard-Faltungsklassifikator nimmt das Bild und sampelt die Bildproduktionswahrscheinlichkeit herunter. Der Generator sampelt das zufällige Rauschen ab, nachdem er es als Vektor genommen hat.
Das Modell verwirft die Downsampling-Technik als erste Daten und generiert neue Daten als zweite, wie z. B. Max-Pooling. Beide Netze werden versuchen, unterschiedliche und gegensätzliche Daten als Verlustfunktion oder Zielfunktion in einem Null-Zum-Spiel zu optimieren. Dies funktioniert wie ein akteurskritisches Modell. Wenn der Diskriminator und der Generator das Verhalten ändern und umgekehrt, werden die Verluste gegeneinander sein.
Schlussfolgerung
Die Technik der inversen Transformation wird Zufallsvariablen erzeugen, die der gegebenen Verteilung folgen, so dass es sich um eine gleichförmige und zufällige Variable handelt. Dies wird durch eine elegante Transformationsfunktion geschehen. Diese inverse Transformationsmethode wird den Begriff der Transformationsmethode erweitern. Außerdem erzeugt sie Zufallsvariablen. Diese Variablen werden die Funktionen von einfacheren Zufallsvariablen entwickeln.