Когда-нибудь в будущем мы сможем надеть очки — и ходить по городу, который рендерится в реальном времени в том стиле, какой нам нравится. Солнечный свет или лёгкая дымка, вечерний закат, что угодно. Независимо от того, насколько унылая архитектура — в очках она будет прекрасной. Такие возможности рендеринга с перенесением стилей открывает потрясающая программа Deep Photo Style Transfer, которая опубликована в открытом доступе, также как и научная работа, лежащая в её основе (arXiv:1703.07511).

Перенос стиля с одного изображения на другое — старая проблема, которую относительно успешно пытались решить разработчики в прошлом. Правильно подобрав образец для переноса стиля, можно красиво трансформировать свою фотографию — как будто она сделана в другое время суток, под иным освещением, в другую погоду или специальным образом художественно обработана. До настоящего времени техники переноса стилей с помощью нейросетей были относительно ограниченными — или они могли работать только с определёнными сценами, или страдала правдоподобность переноса стилей. Авторы новой программы Deep Photo Style Transfer постарались решить все эти проблемы.

Нейросеть Deep Photo Style Transfer построена в соответствии с техникой переноса стилей Neural Style, описанной в работе Гэтиса, но значительно переработана и улучшена. Главное улучшение заключается в фотореалистичности. У Гэтиса даже если исходное изображение и образец являются фотографиями, конечное изображение всё равно напоминает рисунок, где чёткие линии и границы становятся размытыми, а текстуры накладываются на соседние объекты. Выглядит красиво, но не очень реально.

Только цветовое пространство


Результат работы Deep Photo Style Transfer строго фотореалистичен. «Эффекты живописи» устранили за счёт запрета на пространственные искажения. Здесь перенос стилей ограничен только цветовым пространстве. Другими словами, формы объектов остаются точно такими же, как в оригинале. Именно по этой причине в будущем станут возможными «очки», о которых говорилось в начале статьи. Все объекты в окружающей реальности сохранят свои очертания, просто будут выглядеть в другом стиле.

Поставленной задачи авторы добились, использовав специфичный слой нейросети в духе матрицы Кирхгофа (Laplacian matrix) — представления графа в виде матрицы. Как показала проверка на фотографиях с различными сюжетами, такой подход успешно подавляет искажения, в то же время оказывая минимальное влияние на достоверность фотографий.

Наиболее наглядно описанный принцип проявляются в двух специально подобранных примерах.



Как видим, границы объектов чётко сохраняются. Преобразование происходит только в цветовом пространстве. В первом случае стиль огня переносится на флакон с духами, а во втором случае меняется текстура яблок в соответствии с шаблоном.

Семантическая сегментация


Второе достижение авторов программы — решение проблемы с переносом стиля между неподходящими объектами на исходной фотографии и образце стиля. Это сделано за счёт семантической сегментации. Поэтому стили домов переносятся только между домами, и стиль неба влияет только на небо. Во многих случаях семантическая сегментация очень эффективно работает, если только на образце стиля есть те же семантические объекты, что на исходном изображении.

Два вышеупомянутых подхода обеспечили исключительно реалистичное преобразование фотографий.

Оригинал


Образец стиля


Итоговое изображение


Вот ещё несколько примеров.

Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение




Оригинал


Образец стиля


Итоговое изображение

Качество работы такого алгоритма можно определить только по результатам опроса пользователей, которые оценивают фотореализм и достоверность передачи стиля. Такой опрос бы проведён. Он показал, что по уровню фотореализма Deep Photo Style Transfer значительно превосходит представленные ранее разработки Neural Style и CNNMRF, но уступает системе передаче цвета Пити. По достоверности передачи стиля Deep Photo Style Transfer намного лучше других методов.



Авторы научной работы намерены продолжить исследования, чтобы преодолеть существующие ограничения сегментации изображений. Они также считают перспективным направление обработки фотографий в реальном времени с помощью предварительно обученной нейросети.
Поделиться с друзьями
-->

Комментарии (24)


  1. dfgwer
    28.03.2017 00:01
    +4

    Когда они заменили трейдеров, я молчал — я не был трейдером.
    Когда они заменили художников, я молчал — я не был художником.
    Когда они заменили водителей, я молчал — я не был водителем.
    Когда они заменили мена — уже негде было работы для меня.

    Хотя не думаю, что будет быстро. Большинство профессий содержит много разноплановых действий, которые сложно автоматизировать, замена разных видов однотипной рутинной работы растянется надолго. И должна привести к повышению производительности труда и увеличению благосостояния. Надеюсь


  1. maniacscientist
    28.03.2017 00:25

    Фильтр «вариации» в фотошопе давно пора заменить на что нибудь более продвинутое. Хотя хипсторы-манагеры конечно SaaS замутят


  1. MotttoR
    28.03.2017 00:49
    +6

    дизайнеры не нужны!
    image


    1. MikeLP
      28.03.2017 01:14
      -4

      Добавлю немного ложку дегтя. А вот представьте, что такие умные линзы людям с младенчества власти будут принудительно встраивать в глаза.
      Смотриш такой на дом очередной уточки и особняк за забором, а там развалины. Бац — смотриш на свою однушку в панельном доме — и вот тебе евроремонт красивый, и колбаса красиво лежит на полке холодильника, и жена вроде не страшная. Да тут одни плюсы. И волки сыты, и овцы довольны.
      А кстати… вот и готовый сюжет фильма… ну или хотя бы серии Черного Зеркала.


      1. Hellsy22
        28.03.2017 01:43
        +4

        Если человек всем доволен, то он не особо стремится работать. Нужно, чтобы у соседа всегда лежало на одну колбасу больше!


      1. Neuromantix
        28.03.2017 09:36
        +2

        В черном зеркале уже было


        1. Simulation
          29.03.2017 11:56

          Это было в Syndicate 93 года.


      1. Victor_Grigoryev
        28.03.2017 09:58
        +1

        Вы прямо-таки описали типичные новости.


      1. CrHD
        28.03.2017 09:58
        +1

        Пятая серия третьего сезона отчасти подходит под описание.


      1. NLO
        28.03.2017 15:39

        НЛО прилетело и опубликовало эту надпись здесь


  1. TheShock
    28.03.2017 01:20
    +1

    А есть такие программы, чтобы вставить А и Б и получить В?


    1. smart
      28.03.2017 15:45
      +1

      Попробуйте https://deepart.io/ — там, наверное, не такие навороченные алгоритмы, как в этой статье, но суть та же.


  1. Zonzen
    28.03.2017 01:20
    +3

    Смотриш такой на дом очередной уточки и особняк за забором, а там развалины. Бац — смотриш на свою однушку в панельном доме — и вот тебе евроремонт красивый, и колбаса красиво лежит на полке холодильника, и жена вроде не страшная. Да тут одни плюсы. И волки сыты, и овцы довольны.
    А кстати… вот и готовый сюжет фильма… ну или хотя бы серии Черного Зеркала.

    Произведение называется «Футурологический конгресс» за авторством С.Лема, фильм тоже снят, правда очень по мотивам, называется «Конгресс».


    1. boogiebomzh
      28.03.2017 06:36
      +1

      Я сразу подумал о «They Live» Джона нашего Карпентера.


    1. ClearAirTurbulence
      28.03.2017 10:55

      У Клиффорда Саймака такое тоже было, только без VR-очков. Вообще тема древняя, много где всплывала в том или ином виде.


  1. AVX
    28.03.2017 07:13
    +1

    Кто-то пробовал собрать и испытать на своём компе? Что-то там несколько сложновато (для меня) с установкой и использованием. Было бы удобнее одной программой реализовать. Судя по описанию, надо выделенную видеокарту иметь. Заведётся ли на intel hd4600?


    1. Sadler
      28.03.2017 08:42

      Судя по результатам, там простой Style Transfer с минимальными модификациями, можете и на cpu вполне посчитать.


    1. lgorSL
      29.03.2017 22:25

      Кто-то пробовал собрать и испытать на своём компе? Что-то там несколько сложновато (для меня) с установкой и использованием.

      Установка всего показалась сложной и я забил.


      Скачал репозиторий (уже немаленький, потом запустил sh models/download_models.sh — скачалось ещё что-то большого размера)


      скачать cuda — 2гб, скачать cudnn — увлекательная регистрация на сайте нвидии с кучей обязательных вопросов. (кстати, в cmake указана cuda 7.5, исправлял на 8.0)
      Ещё надо поставить torch — это тоже не в одно действие делается :(


  1. DrZlodberg
    28.03.2017 09:27

    Ну с фотореалистичностью они немного погорячились. Косяки на большинстве картинок бросаются в глаза сразу (хотя возможно просто из-за того, что сам так косячил теперь вижу). Особенно с отражениями лажает, т.к. обрабатывает отражение и оригинал раздельно, судя по всему.
    Но всё равно мощно!


  1. nikitastaf1996
    28.03.2017 09:47

    Двумя предложениями.И из красивой статьи сделать очень противоречивую.


  1. Camrad_RIP
    28.03.2017 09:59

    Класс. Что тут еще сказать???


  1. laylari
    28.03.2017 09:59

    Всяко легче прятать унылость, чем не действительно убирать…


  1. nafikovr
    28.03.2017 10:15
    +3

    таки покрывало черное с фиолетовым или белое с золотом?


  1. Akon32
    28.03.2017 10:42

    Забавно.
    Но обработанные фото всё ещё кажутся нереальными. Местами проскакивают лишние градиенты.
    Кроме картинки с яблоками, на неё я вообще не могу отличить, где оригинал.