Reti generative avversarie

In questo articolo, imparerete a conoscere le reti avversarie generative o GAN. Le reti avversarie generative sono l’approccio di modellazione generativa per le tecniche di apprendimento profondo. Questo esempio di GAN include le reti neurali convoluzionali.
La modellazione generativa è un compito di apprendimento automatico per l’apprendimento non supervisionato. Include l’apprendimento di regolarità, scoperte automatiche o modelli come dati di input. In questo modo, il modello può utilizzare nuovi dati generativi per l’apprendimento automatico, che comporta l’apprendimento automatico. È possibile utilizzare tutte le regolarità o i modelli nei dati di input in un modo che genera nuovi esempi che si possono trarre dal set di dati originale.
Utilizzate le GAN per l’addestramento del modello generativo e inquadrate il problema per l’apprendimento supervisionato con due sottomodelli.
Il modello discriminatore classifica gli esempi come falsi (generati) o reali (dominio). È necessario addestrare entrambi questi modelli insieme in un gioco avversario a somma zero. Ciò significa che il modello generatore genera esempi plausibili.
Usiamo il modello generativo per addestrare nuovi esempi.
I campi delle GAN stanno cambiando rapidamente e in modo eccitante nella capacità di creare esempi reali in vari domini. Questo soprattutto quando i compiti riguardano l’immagine, le traduzioni fotografiche dell’immagine come l’inverno all’estate o la notte al giorno. Questo aiuta a generare scene, oggetti e persone fotorealistiche che non riconoscerete come false. Questo articolo vi aiuterà a scoprire le Generative Adversarial Networks o GANs.
La GAN o Generative Adversarial Network funziona come un’architettura algoritmica che utilizza due reti neurali. Entrambe le reti si opporranno a vicenda per generare istanze di dati sintetici e nuovi, passando i dati reali. È possibile utilizzarla per la generazione di video, il riconoscimento vocale e la generazione di immagini. Il potenziale delle GAN può servire sia al male che al bene. Distribuiranno dati e si imiteranno a vicenda. Il loro output sarà notevole per tutti i domini come il discorso, la musica, le immagini e la prosa.
C’è una rete neurale che aiuta a generare le nuove istanze di dati. Gli esperti chiamano questa rete neurale “generatore”. Attraverso l’altra rete neurale, il discriminatore le valuta con autenticità. Significa che il discriminatore deciderà se ogni istanza di dati che valuta appartiene all’effettivo set di dati di allenamento.
Supponiamo di voler imitare la Gioconda. Genereremo numeri scritti a mano che si trovano nel dataset MNIST ricevuto dal mondo reale. L’obiettivo principale del discriminatore, mentre mostra l’istanza con l’aiuto di un vero dataset MNIST, è quello di identificare quelle autentiche.
Nel frattempo, il generatore creerà immagini nuove e sintetiche passando al discriminatore. Questo genererà una nuova immagine simile a quella autentica ma falsa. Il generatore passerà le cifre scritte a mano come obiettivo per mentire senza essere scoperto. Il discriminatore identificherà le immagini che arrivano come false dal generatore. Il GAN può fare i seguenti passi:
– Le immagini generate dal generatore saranno alimentate insieme al flusso di immagini nel generatore che il ground-truth e il dataset reale ricevono.
– Il generatore prenderà i numeri casuali e restituirà l’immagine come output.
– Il discriminatore prenderà sia le immagini false che quelle reali e restituirà le probabilità. Per esempio, se i numeri sono tra 1 e 0. 1 rappresenterà la previsione come autentica, e 0 rappresenterà il falso.
In questo modo, avrete un ciclo con doppio feedback:
– Il generatore e il discriminatore saranno nello stesso ciclo di feedback.
– Il discriminatore sarà nel ciclo di feedback, e le immagini saranno la verità di base.
Per capire il GAN, possiamo considerare il poliziotto e l’opposizione di una contraffazione in un gioco del gatto e del topo. Nel gioco, il contraffattore imparerà a passare le banconote false, e il poliziotto imparerà a rilevare quelle banconote. Entrambi i personaggi saranno dinamici. Per esempio, tutto l’addestramento che il poliziotto riceve si trasferirà all’altro personaggio in una costante escalation.
La rete discriminatrice è la rete convoluzionale standard per MNIST, e questa categorizzerà tutte le immagini che riceve. Il classificatore binominale etichetterà le immagini come false o reali. D’altra parte, il generatore sarà la rete convoluzionale inversa. Il classificatore convoluzionale standard prenderà l’immagine, e declassificherà la probabilità di produzione dell’immagine. Il generatore dis-campionerà il rumore casuale dopo averlo preso come vettore.
Il modello getterà via la tecnica di downsampling come primo dato e genererà nuovi dati come secondo, come il max-pooling. Entrambe le reti cercheranno di ottimizzare dati diversi e opposti come funzione di perdita o funzione obiettivo in un gioco zero-zum. Questo funzionerà come un modello attore-critico. Quando il discriminatore e il generatore cambiano il comportamento e viceversa, le perdite saranno l’una contro l’altra.
La tecnica della trasformazione inversa genererà variabili casuali per seguire la distribuzione data, rendendola una variabile uniforme e casuale. Questo passerà attraverso un’elegante funzione di trasformazione. Questo metodo di trasformazione inversa estenderà la nozione di metodo di trasformazione. Inoltre, genera variabili casuali. Queste variabili svilupperanno le funzioni di variabili casuali più semplici.