Незадолго до празднования самого жуткого дня в году команда из Массачусетского технологического института запустила «Машину кошмаров». Вдохновившись классическими «ужастиками» и возможностями искусственного интеллекта, Пинар Янардаг, Мануэль Кебриан и Ияд Равхан научили нейронную сеть создавать из популярных достопримечательностей мрачные городские пейзажи, а из лиц знаменитостей — пугающие портреты.


Эйфелева башня / MIT

Чтобы «Машина кошмаров» смогла генерировать картинки в духе Хэллоуина, ученые из МТИ использовали «Нейронный алгоритм художественного стиля», снискавший массовую популярность с выходом приложений вроде Prisma и Vinci, которые работают на оптимизированной версии этого алгоритма.

Глубокие нейронные сети состоят из множества слоев. Каждый из них во время обучения способен «захватывать» определенную информацию из картинки в зависимости от того, на какой «глубине» находится слой, и передавать оставшиеся данные следующему. Те, что снаружи, воспринимают только общие черты и цветовые пятна, но чем глубже, тем больше деталей. Информация, извлекаемая более глубокими слоями, имеет решающее значение. Фактически, в этих слоях содержится суть изображения, вне зависимости от контекста (стиля, цвета, текстуры).



В 2015 году специалисты из Тюбингенского Университета в Германии установили, что художественный стиль можно «захватить» из корреляции между слоями. Они смогли отделить содержание изображения от художественного стиля и перенести последний на любую другую картинку.

Точно таким же образом генерируются «пугающие» картинки. Исследователи из МТИ сначала показали нейросети изображения классических домов с привидениями и городов-призраков, определив общие закономерности. Затем искусственный интеллект применил их к новым образцам, населяя римский Колизей призраками и заставляя Тауэрский мост пылать инфернальным огнем.

Трио из МТИ предложило пять разных стилей: от «Дома с приведениями» до «Инферно».

Дом с привидениями



Ночь страха



Токсичный город



Призрачный город



Инферно



Чтобы создать портреты, исследователи пустили в ход неконтролируемый алгоритм обучения для генеративных состязательных сетей. Он был представлен в январе 2015 года Алеком Рэдфордом из компании Indico.

Такой алгоритм как нельзя лучше подходит для создания лиц несуществующих людей. Обученная нейронная сеть может заменять одну заданную деталь на другую. Например, угрюмое мужское лицо на портрете «одарить» ослепительной женской улыбкой, а в интерьере заменить окно дверью. В случае с «Машиной кошмаров» дело обстоит куда более пугающе. Она создает лица, похожие на призрачных сущностей из самого мрачного хоррора, а затем добавляет к ним «щепотку» духа Хэллоуина. Ниже можно посмотреть на готовые «блюда» этой специфической кухни.



Согласно задумке авторов, любой желающий может внести свой вклад в обучение «Машины кошмаров». На сайте проекта открыто голосование за самый жуткий портрет. Выбрав из десяти предложенных изображений самые жуткие, посетитель сайта получает подборку из 36 картинок, которые, по мнению создателей, произведут впечатление именно на него. Результаты голосования будут учитываться в работе нейронной сети.

На сайте «Машины кошмаров» представлена только часть работ. Чтобы увидеть, как Брэд Питт и Барт Симпсон превращаются в зомби, придется зайти в инстаграм-профиль проекта.

Эффект, который производит «Машина кошмаров», сравним с тем, что можно увидеть в DeepDream от Google. Программа ищет и успешно находит на картинке лица и паттерны, которые человеку сложно вообразить.



Результат получается психоделическим, однако изначально разработчики не вкладывали в свое детище пугающий смысл. «Машина кошмаров» — это первый проект, специально предназначенный для того, чтобы картинки выглядели устрашающе.
Поделиться с друзьями
-->

Комментарии (28)


  1. NET_KOT
    25.10.2016 00:34
    +7

    Прямо готовые обложки для музыкальных альбомов в стиле death metal. Или для книг Говарда Лавкрафта.


    1. mypomacca
      25.10.2016 02:29
      +1

      Или некоторым художникам станет легче зарабатывать на жизнь)


  1. killik
    25.10.2016 03:52
    +1

    Тю, я такие пейзажи полгода ежедневно наблюдаю, потому что с прихожу работы в семь-восемь вечера после заката, на уличном освещении экономят, а подсветка зданий фарами машин такой эффект и дает.


    1. Vjatcheslav3345
      25.10.2016 08:29
      +1

      Фоткайте и её обучайте:).

      Интересно, а нельзя ли это как то в играх применить. Карты вот процедурно генерируются, монстры и те же карты наверное могут быть созданы сеткой. А чтобы монстры выходили пострашнее — нужно обучать сетку с генетическим алгоритмом и пульсометром, отмечающим напряжение игрока.


      1. killik
        26.10.2016 04:55

        Тяжело сфотографировать. Экономят же путем втыкания как попало светодиодных ламп, которые светят на копейку, зато ослепляют на рубль. Это камеру надо как у НАСА.


  1. INDUSTRIALIST
    25.10.2016 03:52

    Вопрос не связанный с этой артикулом но по теме «искусственные нейронные сети» от новичка: Почему везде говорят что на входе должно использоваться числа (0; 1 или 0.13), почему не от 0 до 100 или от 0 до 255?


    1. Sadler
      25.10.2016 06:38
      +3

      Нет особой проблемы использовать какой угодно диапазон значений для свёрточной сети, но данные в любом случае должны быть подготовлены. Скажем, я часто использую квантили 10% и 90%, чтобы искусственно сузить диапазон данных по тому или иному параметру и заставить сеть уделять больше внимания тем данным, которые меня интересуют. Для классической сети слишком широкий диапазон приведёт к тому, что сети придётся тратить свои собственные ресурсы на сжатие диапазона, чтобы сигмоиды сети могли работать. Соответственно, некоторые веса сети будут опасно близко к нулю, что создаст дополнительные проблемы, связанные с точностью представления чисел в памяти и приведёт к необходимости значительно снизить скорость обучения сети, чтобы входы не обучились как пороговые. Потому приводите свои данные в соответствие с функцией активации и не забывайте об их представлении в оперативной памяти.


    1. AnNEDoMini
      25.10.2016 09:34

      По всей вероятности при операции умножения двух чисел [0,1] — будет число в том-же диапазоне, только за сложением надо следить.


    1. alex4321
      25.10.2016 13:33

      Скорее сравнимого порядка, не?
      >>> a=0.0000000001
      >>> a
      1e-10
      >>> b=100000
      >>> for i in range(0, 10000):
      … a+=b

      >>> a-=10000*b
      >>> a
      0.0


  1. lgorSL
    25.10.2016 04:19
    +5

    Кошмары как-то не пугают, а вот последняя картинка с собакой действительно жутковато смотрится.


    1. isden
      25.10.2016 09:54
      -1

      Вот кстати, сколько картинок от DeepDream видел, везде все всегда сводится к собакам и глазам. Ну почему???


      1. vc9ufi
        25.10.2016 10:20

        Первую широко известную сеть учили на собаках. Этих собак почему-то постоянно вставляют в статьи о сетях и почему-то всегда находится кто-нибудь спрашивающий «почему собаки?».


      1. killik
        25.10.2016 10:23

        https://geektimes.ru/company/mailru/blog/281656/
        «Эта способность объясняется тем, что распознавание изображения строится на входном наборе данных. В Deep Dream используется база ImageNet университетов Стэнфорда и Принстона, состоящая из 14 миллионов фотографий, проанализированных людьми. Но в Google использовали не все ресурсы ImageNet, а только каталог, содержащий классификацию 120 подклассов собак.
        »


      1. Mii
        25.10.2016 13:31

        просто собака идеальный генератор серии картинок в кратчайшее время для изменения сознания, при этом ей самой эти состояния неизвестны и она это делает тупо за еду.


    1. KonstantinSoloviov
      25.10.2016 12:10

      Не жутко, а мерзко потому что — трипофобия. Тут недавно статья была так эту дурацкую картинку как КДПВ использовали. Нифига хорошего пока у нейросетей не выходит, так что пока генерим ужастики.


  1. kentaskis
    25.10.2016 05:23
    +1

    Способ генерить фотки якобы из горячих точек, сидя в уютненьком офисе. Скоро увидим новые «зверства» из страна1, страна2, страна3,…


    1. Ra-Jah
      25.10.2016 09:40
      +3

      Идите дальше, страны тоже можно генерировать. Целые новостные телеканалы могут автоматически создавать новости об ужасах в Остазии.


      1. Kinardus
        25.10.2016 13:50
        +1

        Или как авианосцы швартуются на границе республики Беларусь.


    1. dimm_ddr
      25.10.2016 14:37

      Как будто для этого нужны сети. «Хвост виляет собакой» — хороший старенький уже фильм на тему.


  1. xtala
    25.10.2016 11:15

    Когда я смотрю на картины нарисованные AI меня не покидает ощущение, что у машины шиза. Или как минимум биполярное расстройство. Перспектива восстания сумасшедших роботов как никогда реальна :)


    1. RussDragon
      25.10.2016 11:32

      Да, нейросеть взломает Ваш компьютер и профильтрует все фотографии с отдыха в Призме или Дипдриме, без бэкапа. Настоящий ужас ;)


      1. xtala
        25.10.2016 12:19

        Ну скажем взломать шифры ей не позволит царица всех наук математика, а вот перспектива оснащения боевых БПЛА и сторожевых турелей AI на основе нейросети по распознаванию лиц более чем реальна. И это пугает.


        1. ChiefPilot
          25.10.2016 14:13
          +1

          Похоже, что в первую очередь непоздоровится собакам! :)


          1. alex4321
            25.10.2016 19:59

            Велосипедисты тоже в опасности :-)image


  1. DROS
    25.10.2016 15:00
    +1

    Когда они уже все наиграются с генерированием подобных картинок и займутся делом? Что не нейросеть, то сразу же надо показать какой треш она умеет генерить на основе фотографии. Какова практическая польза от этого? Я что-то просто не понимаю =(


    1. hp6812er
      25.10.2016 16:09
      +1

      Польза?
      Мне просто понравился результат. А кто то захочет его повторить и возможно больше узнает о том, что есть такие нейросети. Популяризация науки.


  1. ycappie
    25.10.2016 19:29
    +1

    Осталось упаковать это все в приложение «Pentagram» и можно релизить. :)


  1. dadyjo
    27.10.2016 12:39

    На картины Дали чем то похоже, особенно последняя.