Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Últimamente, hice un puerto Tensorflow de pix2pix de Isola et al., envuelto en el artículo “Picture to Picture Interpretation in Tensorflow”. He tomado un par de modelos preparados e hice una cosa intuitiva en la web para darles una oportunidad. Se prescribe cromo.

El modelo pix2pix funciona mediante la preparación de conjuntos de imágenes, por ejemplo, desde nombres de exteriores de edificios hasta chapas de edificios, y después se esfuerza por producir la imagen de rendimiento relativa a partir de cualquier imagen de información que se le proporcione. El pensamiento es directamente del papel pix2pix, el cual es un buen análisis

Preparado en unas 2k fotografías de felinos y bordes creados naturalmente a partir de esas fotografías. Crea artículos sombreados felinos, algunos con rostros de pesadilla. El mejor que he visto en este punto fue un espectador felino.

Una parte de las fotos se ven particularmente espantosas, creo que ya que es más simple ver cuando una criatura se ve mal, particularmente alrededor de los ojos. Los bordes auto-reconocidos no son excelentes y en general no identificaron los ojos del felino, lo que agravó una pieza para preparar el modelo de interpretación de la foto.

Preparado en una base de datos de chapas de edificios a exteriores de construcción con nombre. No parece estar seguro de cómo manejar una enorme región vacía, sin embargo, en el caso de que se pongan suficientes ventanas allí, a menudo tiene resultados sensatos. Dibuja formas cuadradas de sombreado “divisorias” para erradicar las cosas.

No tenía los nombres de las diferentes piezas de las chapas de construcción, así que pensé en cómo se llamaban.

Preparado en una base de datos de fotos de zapatos de ~50k reunidas de Zappos junto a bordes producidos de esas fotos naturalmente. En caso de que seas bueno dibujando los bordes de los zapatos, puedes intentar crear algunas estructuras nuevas. Recuerda que está preparado en artículos genuinos, así que en el caso de que puedas dibujar más cosas en 3D, parece funcionar mejor.

Como la anterior, preparada en una base de datos de ~137k fotos de mochila recogidas en el Amazonas y bordes producidos naturalmente a partir de esas fotos. Por si acaso dibujas un zapato aquí en lugar de un bolso, obtienes un zapato extrañamente acabado.

Ejecución

Los modelos fueron preparados y enviados con el contenido de pix2pix.py de pix2pix-tensorflow. La demostración inteligente se hace en javascript utilizando la interfaz de programación del lienzo y ejecuta el modelo utilizando el segmento de conjuntos de datos en GitHub. Cada uno de los descargados cerca del primer uso de pix2pix debería ser accesible. Los modelos utilizados para el uso de javascript son accesibles en los modelos pix2pix-tensorflow-models.