Od niedawna wykonałem port Tensorflow pix2pix Isola et al., owiany w artykule Picture to-Picture Interpretation w Tensorflow. Wziąłem kilka przygotowanych modeli i zrobiłem intuicyjny web thing za danie im ujęcia. Chrom jest przepisany.

Model pix2pix działa poprzez przygotowanie na zestawach zdjęć, na przykład, nazwy zewnętrzne budynków do fornirów budowlanych, a następnie stara się produkować odnoszące się do wydajności obrazu z każdego obrazu informacji, które dajesz go. Myśl ta pochodzi bezpośrednio z papieru pix2pix, który jest przyzwoitym perused

Przygotowane na około 2k zdjęciach kotów rasowych i krawędziach naturalnie powstałych z tych zdjęć. Tworzy kocie cieniowane artykuły, niektóre z twarzami złych snów. Najlepsze, jakie widziałem w tym momencie to kocie spojrzenie.

Część zdjęć wygląda szczególnie okropnie, myślę, że łatwiej jest zobaczyć, kiedy istota wygląda źle, szczególnie wokół oczu. Automatycznie rozpoznawane krawędzie nie są doskonałe i w zasadzie nie identyfikują oczu kota, co pogarsza jego sytuację, a co za tym idzie, jest to element przygotowujący model do interpretacji obrazu.

Przygotowane na bazie danych fornirów budowlanych do nazwanych konstrukcją zewnętrzną. Nie wydaje się, aby było to bezpieczne przy zarządzaniu ogromnym obszarem pustki, jednak w przypadku, gdy umieścimy tam wystarczająco dużo okien, często ma to sens. Narysuj “rozdzielacz” zacieniający kwadratowe kształty, aby wyeliminować wszystko.

Nie miałem nazw poszczególnych elementów oklein budowlanych, więc pomyślałem tylko o tym, jak się nazywają.

Przygotowane na bazie danych ~50k zdjęć butów zebranych z Zappos obok krawędzi wyprodukowanych naturalnie z tych zdjęć. Jeśli jesteś świetny w rysowaniu krawędzi butów, możesz spróbować stworzyć kilka nowych struktur. Pamiętaj, że jest on przygotowany na oryginalnych przedmiotach, więc na wszelki wypadek, gdybyś mógł narysować więcej rzeczy 3D, wydaje się, że działa lepiej.

Podobnie jak w przeszłości, przygotowano na bazie ~137k zdjęć tornistrowych zebranych z Amazonii i z tych zdjęć w sposób naturalny powstały krawędzie. Na wypadek, gdybyś narysował tu buta, a nie pojemnik, otrzymujesz dziwnie wykończony but.

Egzekucja

Modele zostały przygotowane i wysłane z zawartością pix2pix.py z pix2pix-tensorflow. Inteligentne demo zostało wykonane w javascript z wykorzystaniem interfejsu Canvas Programming i uruchamia model z wykorzystaniem segmentu Datasets na GitHubie. Każdy z nich rozładowany w pobliżu pierwszego użycia pix2pix powinien być dostępny. Modele wykorzystujące javascript są dostępne w modelach pix2pix-tensorflow-modelach przepływu.