Google уже демонстрировала, как нейросеть создаёт картины в стиле Ван Гога и Пикассо, но такой метод не подходит для видео: результат покадрового изменения фильма будет сложно склеить. Немецкие учёные справились с этой проблемой — их нейросеть распознаёт объекты в кадре, запоминает их и использует один и тот же стиль для отрисовки, когда они появляются снова.

image
Переработка кадров из фильма «Ледниковый период» в стиле «Звёздной ночи» Ван Гога

Нейронные сети обучают с помощью большого количество изображений. Каждая такая сеть состоит из ряда слоёв — от двух до 30 — с разным уровнем абстракции. Фотография или рисунок для получения конечного результата проходит через все эти слои. В июле 2015 года Google продемонстрировала, как нейросеть создаёт произведения искусства из рандомного шума.

image

В том же году в университете Тюбингена, Германия, провели эксперимент, который продемонстрировал способность нейросети подделывать художественный стиль великих мастеров — Ван Гога, Пикассо, Мунка и других. В качестве исходника используются любые изображения и фотографии. Результаты — на изображении ниже. Главным достижением авторы эксперимента посчитали возможность независимо управлять контентом и стилем в нейросети.

image

На исследование учёных из университета Тюбингена ссылаются Алексей Досовицкий, Мануэль Рудер и Томас Брокс из университета Фрайбурга, Германия. Учёные улучшили возможности нейросети для того, чтобы изменять не отдельные изображения, а видеоряд. В случае покадрового изменения объекты в каждом кадре могут быть переработаны различно, и результат будет сложно совместить. Учёные справились с этой проблемой, научив нейросеть распознавать объекты, следить за тем, чтобы их отображение не менялось слишком сильно в видео, и использовать каждый раз при их появлении один и тот же стиль.

Поделиться с друзьями
-->

Комментарии (32)


  1. ILITARIY
    14.05.2016 13:19

    недавно под нбомом и без нейросетей у меня все перекрашивалось, причем поэффектнее.


    1. atomlib
      14.05.2016 13:28
      +3

      У вас тоже есть нейросети, только ествественные, не искусственные.


    1. CyberAndrew
      14.05.2016 15:10
      +2

      Сейчас прибежит Роскомнадзор и забанит вас по IP квартире забанит гиктаймс за упоминание наркотиков.


  1. DROS
    14.05.2016 14:06
    +2

    Вот если бы оно на голые модели таким образом текстуры само накладывало — вот это была бы польза, а так…


    1. gene4000
      14.05.2016 14:10
      +10

      голые модели?


      1. glebokator
        14.05.2016 15:27

        Видимо имелись ввиду трёхмерные модели)


      1. 4vacLegs
        14.05.2016 15:27
        +2

        да, предварительно убрав презервативы.


      1. DROS
        14.05.2016 15:38
        +2

        Нда, действительно стоило уточнить — на 3D


        1. gene4000
          14.05.2016 17:48
          +1

          Еще лучше ;)


    1. CyberAndrew
      14.05.2016 15:11
      +3

      Черный цензурический квадрат?


    1. virtual_universe
      14.05.2016 15:28

      Эмм… как говорится #лолшто


      1. ivansychev
        15.05.2016 08:53

        Несколько раз прочитал как #пошло. Не знаю, почему.


    1. Finesse
      15.05.2016 05:03

      Понятно, если на одетые модели, а на голые модели то зачем?


    1. leshabirukov
      15.05.2016 14:22
      +1

      … или например дорисовывало промежуточные кадры для мультипликации, раскрашивало чёрно-белые комиксы (с учётом освещения сцены), и делало прочую чёрную работу за художников.


      1. Murmurianez
        15.05.2016 20:20

        Да вполне реально. Во всяком случае откровенной фантастикой уже не выглядит.


      1. vc9ufi
        16.05.2016 09:14

        SmoothVideo Project добавляет кадры. Так же телевизоры сейчас поднимают фпс до 60.


        1. leshabirukov
          16.05.2016 10:17

          Нейросеть сделает лучше. В алгоритмическом решении всех контекстов, симметрий и ситуаций не учесть. Пример: дорисовать частично закрытое лицо, или правильно наложить тень.


  1. Mulin
    14.05.2016 14:59
    +1

    Низки поклон от видиоинженеров будет тогда, когда нейросеть научат вырезать сложные объекты из фона без использования сложных масок, хромакея и тому подобных ухищрений.


    1. artF
      14.05.2016 16:17
      +1

      Ранее на хабре уже говорили о программе, которая убирает людей с фотографии (которая делается по видео), причем неоднократно данная технология описывалась. Чем не сложные объекты? Мне кажется скопировать стиль куда сложнее, чем убрать лишние объекты, по этому поклон инженерам Google и всем тем кто вообще подобные штуки реализовывает.


      1. Mulin
        15.05.2016 16:08

        Я вам про Фому, вы мне про Ярему. Какое отношение удаление объектов с фото имеет к видеокомпозингу? Я как видиоинженер с многолетним стажем утверждаю, что есть в композинге фундаментальная задача — вырезание объектов из фона. Точнее максимальная автоматизация процесса. Для видеоинженера важность достижения определяется не сложностью специфической задачи, а необходимостью ее применения. Не спорю — возможно есть сферы, где требуется убирать людей с фото, но я же речь вел о композинге (видиоинжиниринге, если хотите). Что, в данном случае сложнее, я бы поспорил. В упомянутой выше фундаментальной задаче, есть, опять же, фундаментальные проблемы. Во-первых, это вырезание из фона людей, имеющих пышную шевелюру (не забыли — речь идет о видеоряде), и во-вторых — работа с полупрозрачными объектами, например элементы одежды из тонкой ткани.


    1. BelBES
      14.05.2016 17:20

      Статичный фон, пр одинаковом освещении вырезается довольно неплохо.


  1. 4eyes
    14.05.2016 15:28

    Ожидал увидеть пример с каноничной Lenna.


  1. BelBES
    14.05.2016 15:46
    +2

    Пробовал поиграться с этой штукой. Из-за долгого вычисления оптического потока, а потом оптимизации каждого кадра по отдельности, работает очень долго, и на тестовом видео результаты получились так себе:



    Вот этот крошечный фрагмент видео просчитывался ~10 часов на gtx980ti.


    1. stepik777
      14.05.2016 17:00

      Он у вас походу ещё и пожат слишком сильно


      1. BelBES
        14.05.2016 17:18

        Исходное видео было 360p, на выходе генерил видео 450x350, видео клеил avconv'ом, вроде бы без потери качества.


    1. Lsh
      16.05.2016 23:42

      Что-то я не понял, где ее скачать?


      1. BelBES
        16.05.2016 23:55

        В описании к видео есть ссылка на github репозиторий.


  1. Tertium
    14.05.2016 21:31
    +1

    сейчас уже к сожалению не помню, у кого, есть замечательный рассказ про моды разных художников, ставишь такой мод себе в голову и все вокруг видишь «глазами» Шагала или, например, Кандинского. там еще ГГ с женщиной познакомился и вместе с ней окунался в восприятие художников, потом ей надоело, произошел рассинхрон и ГГ ее уже не смог или не захотел найти. такой вобщем-то эмоционально-романтический рассказ. если через лет 10 такие алгоритмы усовершенствуют и упростят до уровня фильтра в инстаграм, будет близко к тому рассказу, только не в голову, а в какой-нибудь гуглоглаз


    1. BelBES
      14.05.2016 22:38
      +1

      Кстати неплохая идея апликухи для очков от MS)


      1. Zibx
        15.05.2016 02:42
        +1

        Идея хорошая, а вот с реализацией будет плохо. Во всяком случае пока закон мура не возьмёт своё через 10 лет.


        1. BelBES
          15.05.2016 17:16

          Что нам закон Мура? Крупные игроки индустрии вовсю пилят спец. железо для запуска сеток, т.ч. еще 1-2 года и все это пойдет в продакшен)


  1. Idot
    15.05.2016 20:11

    А можно перекрасить Южный Парк и World of Tommorow под Аниме?