Обзор искуственных интеллектов
В этом обзоре хочу поделиться ссылками на техники, появившиеся после взлета DeepMind и шумихи вокруг него. И генерирующие нейронные сети.
StyleGAN
Начну со странички, которая выводит несуществующие комнаты. Сеть обучили на AirBnB. Автор утверждает, что смог достаточно быстро обучить сеть, не имея никаких знаний о них, и что любой теперь может обучить и обманывать невнимательных людей. Вдохновлялся он вот этой работой, которую очень быстро распространила сеть. Об этом всём он пишет на этой страничке.
Но та, что генерирует портреты, послужила вдохновением не только для этого сайта, также было создано коммьюнити на reddit, которое отлавливает те моменты, когда генерация пошла как-то не так.
Но если с лицами генерация проходит обычно более-менее хорошо, то с котами не получилось с самого начала. Котам, сгененрированным таким образом, редко везёт быть полностью с руками-ногами и головой, да еще так чтобы хозяином твоим был не пришелец из другого измерения.
Даже анимешных девочек не минула чаша сия. Там тоже бывают проколы и выглядят они все достаточно одинаково.
GauGAN
NVidia натренировала сеть на картинках фликра для вывода фотореалистичных пейзажей, в отличие от StyleGAN, пользователь может управлять процессом создания пейзажа ссылка.
DeepDream DeepStyle
Одна из первых технологий появившихся на волне переоткрытия нейронных сетей. Умеет смешивать стили двух изображений и выдавать результат, сейчас есть рабочая реализация, которую в основном используют, и есть небольшое коммьюнити, которое с этим играется.
Появляется раскраска фотографий с помощью сетей.
DeepFake
Вторая технология которая была применена после DeepDream и уже сконцентрирована на копировании мимики и движения головы, за два года технология выросла, и сейчас сети меньше лажают с наложением и освещением, чем первые реализации. Полюбоваться на работающие примеры можно здесь. Можно попробовать натренировать сеть, как здесь Оригинальная статья на SIGGRAPH. Видео раз и видео два.
Pix2Pix
Другой подход: края изображения мы ассоциируем с самим изображением и получаем новое изображение. Практически то же, что у NVidia с разными изображениями. Вот живое демо, где можно это посмотреть
Вывод
Для того чтобы использовать эти сети, вам потребуется достаточно большой набор уже существующих сущностей и куча времени, чтобы обучить эти сети. На выходе вы получите такие же сущности, синтезированные с тем что есть. Для создания альтернативной реальности введение несуществующих, но очень похожих на реальные объектов и субъектов. Это не очень большой набор задач для создания, если честно.