En este artículo, aprenderás sobre las redes generativas adversariales o GANs. Las redes adversariales generativas son el enfoque de modelado generativo para las técnicas de aprendizaje profundo. Este ejemplo de GAN incluye redes neuronales convolucionales.
El modelado generativo es una tarea de aprendizaje automático para el aprendizaje no supervisado. Incluye el aprendizaje de regularidades, descubrimientos automáticos o patrones como datos de entrada. De este modo, el modelo puede utilizar nuevos datos generativos para el aprendizaje automático. Puede utilizar todas las regularidades o patrones de los datos de entrada de forma que genere nuevos ejemplos que pueda extraer del conjunto de datos original.
Utiliza GANs para entrenar el modelo generativo y enmarcar el problema para el aprendizaje supervisado con dos submodelos.

– Modelo discriminador

El modelo discriminador clasifica los ejemplos como falsos (generados) o reales (dominio). Es necesario entrenar estos dos modelos juntos en un juego adversario de suma cero. Esto significa que el modelo generador genera ejemplos plausibles.

– Modelo generador

Utilizamos el modelo generador para entrenar nuevos ejemplos.
Los campos de las GANs están cambiando rápida y emocionantemente en la capacidad de crear ejemplos reales en varios dominios. Esto es especialmente cuando las tareas se relacionan con la imagen, con las traducciones de fotos de la imagen, como de invierno a verano o de noche a día. Esto ayuda a generar escenas, objetos y personas fotorrealistas que no reconocerás como falsas. Este artículo te ayudará a descubrir las Redes Generativas Adversariales o GANs.

Qué son las GAN

La GAN o Generative Adversarial Network funciona como una arquitectura algorítmica que utiliza dos redes neuronales. Ambas redes se opondrán entre sí para generar instancias de datos sintéticos y nuevos, pasando los datos reales. Se puede utilizar para la generación de vídeo, el reconocimiento de voz y la generación de imágenes. El potencial de las GAN puede servir tanto para el mal como para el bien. Distribuirán los datos y se mimetizarán entre sí. Su resultado será notable para todos los dominios, como el habla, la música, las imágenes y la prosa.

Cómo funcionan las GAN

Hay una red neuronal que ayuda a generar las nuevas instancias de datos. Los expertos llaman a esta red neuronal “generadora”. A través de la otra red neuronal, el discriminador las evalúa con autenticidad. Esto significa que el discriminador decidirá si cada instancia de datos que evalúa pertenece al conjunto de datos de entrenamiento real.
Supongamos que queremos imitar a la Mona Lisa. Vamos a generar los números escritos a mano que se encuentran en el conjunto de datos MNIST recibidos del mundo real. El objetivo principal del discriminador, al mostrar la instancia con la ayuda de un conjunto de datos MNIST verdadero, es identificar los auténticos.
Mientras tanto, el generador creará imágenes nuevas y sintéticas pasando al discriminador. Esto generará una nueva imagen similar a la auténtica pero falsa. El generador pasará los dígitos escritos a mano como objetivo para mentir sin ser descubierto. El discriminador identificará las imágenes que vienen como falsas desde el generador. El GAN puede seguir los siguientes pasos:
– Las imágenes generadas por el generador se introducirán junto con el flujo de imágenes en el generador que reciben el conjunto de datos reales y de verdad.
– El generador tomará los números aleatorios y devolverá la imagen como salida.
– El discriminador tomará tanto las imágenes falsas como las reales y devolverá las probabilidades. Por ejemplo, si los números están entre 1 y 0. 1 representará la predicción como auténtica, y 0 representará la falsa.
De esta manera, se tendrá un bucle con doble retroalimentación:
– El generador y el discriminador estarán en el mismo bucle de retroalimentación.
– El discriminador estará en el bucle de retroalimentación, y las imágenes serán la verdad de base.
Para entender el GAN, podemos considerar el policía y la oposición de un falsificador en un juego de ratón y gato. En el juego, el falsificador aprenderá a pasar los billetes falsos, y el policía aprenderá a detectar esos billetes. Ambos personajes serán dinámicos. Por ejemplo, todo el entrenamiento que reciba el policía se trasladará al otro personaje en una escalada constante.
La red discriminadora es la red convolucional estándar de MNIST, y ésta categorizará todas las imágenes que reciba. El clasificador binominal etiquetará las imágenes como falsas o reales. Por otro lado, el generador será la red convolucional inversa. El clasificador convolucional estándar tomará la imagen y desmuestreará la probabilidad de producción de la imagen. El generador desmuestreará el ruido aleatorio después de tomarlo como vector.
El modelo desechará la técnica de downsampling como primer dato y generará nuevos datos como segundo, como el max-pooling. Ambas redes tratarán de optimizar datos diferentes y opuestos como función de pérdida o función objetivo en un juego de suma cero. Esto funcionará como un modelo actor-crítico. Cuando el discriminador y el generador cambian el comportamiento y viceversa, las pérdidas serán opuestas.

Conclusión

La técnica de la transformación inversa generará variables aleatorias para seguir la distribución dada, convirtiéndola en una variable uniforme y aleatoria. Esto pasará por una elegante función de transformación. Este método de transformación inversa ampliará la noción del método de transformación. Además, genera variables aleatorias. Estas variables desarrollarán las funciones de variables aleatorias más simples.