A partir de então, fiz uma porta de Tensorflow de pix2pix de Isola et al., envolto no artigo Interpretação de Imagem a Imagem em Tensorflow. Eu peguei alguns modelos pré-preparados e fiz uma coisa intuitiva na web para dar uma chance a eles. O cromo é prescrito.

O modelo pix2pix funciona através da preparação em conjuntos de imagens, por exemplo, construindo nomes exteriores a fachadas de edifícios, e depois se esforça para produzir a imagem de rendimento relacionado a partir de qualquer imagem de informação que você lhe dá. O pensamento é diretamente do papel pix2pix, que é uma imagem decente e usada

Preparado em cerca de 2k fotografias de felinos de estoque e bordas naturalmente criadas a partir dessas fotografias. Cria artigos com sombras felinas, alguns com rostos de pesadelos. O melhor que eu já vi neste momento foi um observador de felinos.

Uma parte das fotos parecem particularmente horríveis, acho que já que é mais simples ver quando uma criatura parece errada, particularmente em torno dos olhos. As bordas auto-reconhecidas não são excelentes e, em geral, não identificaram os olhos do felino, agravando uma peça para preparar o modelo de interpretação da foto.

Preparado em um banco de dados de fachadas de edifícios para nomear os exteriores da construção. Não parece estar seguro de como gerenciar uma enorme região vazia, porém, caso você coloque janelas suficientes lá, muitas vezes tem resultados sensatos. Desenhe “divisórias” de sombreamento de formas quadradas para erradicar as coisas.

Eu não tinha os nomes das várias peças de fachadas dos prédios, então eu só pensei no que eles eram chamados.

Preparado em um banco de dados de ~50k fotos de sapatos coletadas de Zappos ao lado de bordas produzidas naturalmente a partir dessas fotos. Caso você seja ótimo no desenho das bordas de sapatos, você pode tentar criar algumas novas estruturas. Lembre-se que é preparado em itens genuínos, então na chance de você desenhar mais coisas em 3D, parece funcionar melhor.

Como a anterior, preparada em um banco de dados de ~137k fotos de mochila coletadas da Amazônia e naturalmente produzidas bordas a partir dessas fotos. Na hipótese de você desenhar um sapato aqui ao invés de um tote, você ganha um sapato estranhamente acabado.

Execução

Os modelos foram preparados e enviados com o conteúdo pix2pix.py do fluxo pix2pix-tensor. A demonstração inteligente é feita em javascript utilizando a interface de Programação Canvas e executa o modelo utilizando o segmento Datasets no GitHub. Cada um dos que são descarregados próximos ao primeiro uso de pix2pix deve estar acessível. Os modelos utilizados para o uso do javascript são acessíveis em modelos de fluxo pix2pix-tensor.