Dernièrement, j’ai fait un portage de pix2pix à Tensorflow par Isola et al. qui a fait l’objet d’un article intitulé “Picture to Picture Interpretation in Tensorflow”. J’ai pris quelques modèles préparés à l’avance et j’ai créé un site web intuitif pour leur donner une chance. Le chrome est prescrit.

Le modèle pix2pix fonctionne en préparant des séries d’images, par exemple, des noms d’extérieur de bâtiments aux placages de bâtiments, et s’efforce ensuite de produire l’image de rendement correspondante à partir de toute image d’information que vous lui donnez. L’idée est directement issue du papier pix2pix, qui est un bon outil de travail.

Préparé sur environ 2k stock de photographies félines et bords naturellement créés à partir de ces photographies. Crée des articles félins ombragés, certains avec des visages de mauvais rêve. Le meilleur que j’ai vu à ce stade était un spectateur félin.

Une partie des photos a l’air particulièrement épouvantable, je pense qu’il est plus simple de voir quand une créature a l’air mal, surtout autour des yeux. Les bords auto-reconnus ne sont pas excellents et, dans l’ensemble, n’ont pas permis d’identifier les yeux du félin, ce qui l’a aggravé un peu pour préparer le modèle d’interprétation des photos.

Préparé sur une base de données des placages de construction à l’extérieur de construction nommé. Il ne semble pas être sûr de savoir comment gérer une énorme région vide, cependant, si vous y mettez suffisamment de fenêtres, cela a souvent des résultats sensés. Dessinez des “diviseurs” en ombrageant des formes carrées pour éradiquer les choses.

Je n’avais pas les noms des différentes pièces de placage de construction, alors j’ai juste pensé à leur nom.

Préparé sur une base de données d’environ 50 000 photos de chaussures recueillies auprès des Zappos, avec des bords produits naturellement à partir de ces photos. Si vous êtes doué pour dessiner les bords des chaussures, vous pouvez essayer de créer de nouvelles structures. N’oubliez pas qu’elle est préparée sur des objets authentiques, donc si par hasard vous pouvez dessiner plus de choses en 3D, cela semble mieux fonctionner.

Comme la précédente, préparée sur une base de données de ~137k photos de sacoches recueillies en Amazonie et dont les bords ont été naturellement produits à partir de ces photos. Si par hasard vous dessinez ici une chaussure plutôt qu’un fourre-tout, vous obtenez une chaussure étrangement finie.

Exécution

Les modèles ont été préparés et envoyés avec le contenu de pix2pix.py de pix2pix-tensorflow. La démo intelligente est réalisée en javascript à l’aide de l’interface Canvas Programming et exécute le modèle en utilisant le segment Datasets sur GitHub. Tous ceux qui sont déchargés à proximité de la première utilisation de pix2pix devraient être accessibles. Les modèles utilisés pour l’utilisation du javascript sont accessibles sur les modèles pix2pix-tensorflow.