Незадолго до празднования самого жуткого дня в году команда из Массачусетского технологического института запустила «Машину кошмаров». Вдохновившись классическими «ужастиками» и возможностями искусственного интеллекта, Пинар Янардаг, Мануэль Кебриан и Ияд Равхан научили нейронную сеть создавать из популярных достопримечательностей мрачные городские пейзажи, а из лиц знаменитостей — пугающие портреты.
Эйфелева башня / MIT
Чтобы «Машина кошмаров» смогла генерировать картинки в духе Хэллоуина, ученые из МТИ использовали «Нейронный алгоритм художественного стиля», снискавший массовую популярность с выходом приложений вроде Prisma и Vinci, которые работают на оптимизированной версии этого алгоритма.
Глубокие нейронные сети состоят из множества слоев. Каждый из них во время обучения способен «захватывать» определенную информацию из картинки в зависимости от того, на какой «глубине» находится слой, и передавать оставшиеся данные следующему. Те, что снаружи, воспринимают только общие черты и цветовые пятна, но чем глубже, тем больше деталей. Информация, извлекаемая более глубокими слоями, имеет решающее значение. Фактически, в этих слоях содержится суть изображения, вне зависимости от контекста (стиля, цвета, текстуры).
В 2015 году специалисты из Тюбингенского Университета в Германии установили, что художественный стиль можно «захватить» из корреляции между слоями. Они смогли отделить содержание изображения от художественного стиля и перенести последний на любую другую картинку.
Точно таким же образом генерируются «пугающие» картинки. Исследователи из МТИ сначала показали нейросети изображения классических домов с привидениями и городов-призраков, определив общие закономерности. Затем искусственный интеллект применил их к новым образцам, населяя римский Колизей призраками и заставляя Тауэрский мост пылать инфернальным огнем.
Трио из МТИ предложило пять разных стилей: от «Дома с приведениями» до «Инферно».
Дом с привидениями
Ночь страха
Токсичный город
Призрачный город
Инферно
Чтобы создать портреты, исследователи пустили в ход неконтролируемый алгоритм обучения для генеративных состязательных сетей. Он был представлен в январе 2015 года Алеком Рэдфордом из компании Indico.
Такой алгоритм как нельзя лучше подходит для создания лиц несуществующих людей. Обученная нейронная сеть может заменять одну заданную деталь на другую. Например, угрюмое мужское лицо на портрете «одарить» ослепительной женской улыбкой, а в интерьере заменить окно дверью. В случае с «Машиной кошмаров» дело обстоит куда более пугающе. Она создает лица, похожие на призрачных сущностей из самого мрачного хоррора, а затем добавляет к ним «щепотку» духа Хэллоуина. Ниже можно посмотреть на готовые «блюда» этой специфической кухни.
Согласно задумке авторов, любой желающий может внести свой вклад в обучение «Машины кошмаров». На сайте проекта открыто голосование за самый жуткий портрет. Выбрав из десяти предложенных изображений самые жуткие, посетитель сайта получает подборку из 36 картинок, которые, по мнению создателей, произведут впечатление именно на него. Результаты голосования будут учитываться в работе нейронной сети.
На сайте «Машины кошмаров» представлена только часть работ. Чтобы увидеть, как Брэд Питт и Барт Симпсон превращаются в зомби, придется зайти в инстаграм-профиль проекта.
Эффект, который производит «Машина кошмаров», сравним с тем, что можно увидеть в DeepDream от Google. Программа ищет и успешно находит на картинке лица и паттерны, которые человеку сложно вообразить.
Результат получается психоделическим, однако изначально разработчики не вкладывали в свое детище пугающий смысл. «Машина кошмаров» — это первый проект, специально предназначенный для того, чтобы картинки выглядели устрашающе.
Комментарии (28)
killik
25.10.2016 03:52+1Тю, я такие пейзажи полгода ежедневно наблюдаю, потому что с прихожу работы в семь-восемь вечера после заката, на уличном освещении экономят, а подсветка зданий фарами машин такой эффект и дает.
Vjatcheslav3345
25.10.2016 08:29+1Фоткайте и её обучайте:).
Интересно, а нельзя ли это как то в играх применить. Карты вот процедурно генерируются, монстры и те же карты наверное могут быть созданы сеткой. А чтобы монстры выходили пострашнее — нужно обучать сетку с генетическим алгоритмом и пульсометром, отмечающим напряжение игрока.killik
26.10.2016 04:55Тяжело сфотографировать. Экономят же путем втыкания как попало светодиодных ламп, которые светят на копейку, зато ослепляют на рубль. Это камеру надо как у НАСА.
INDUSTRIALIST
25.10.2016 03:52Вопрос не связанный с этой артикулом но по теме «искусственные нейронные сети» от новичка: Почему везде говорят что на входе должно использоваться числа (0; 1 или 0.13), почему не от 0 до 100 или от 0 до 255?
Sadler
25.10.2016 06:38+3Нет особой проблемы использовать какой угодно диапазон значений для свёрточной сети, но данные в любом случае должны быть подготовлены. Скажем, я часто использую квантили 10% и 90%, чтобы искусственно сузить диапазон данных по тому или иному параметру и заставить сеть уделять больше внимания тем данным, которые меня интересуют. Для классической сети слишком широкий диапазон приведёт к тому, что сети придётся тратить свои собственные ресурсы на сжатие диапазона, чтобы сигмоиды сети могли работать. Соответственно, некоторые веса сети будут опасно близко к нулю, что создаст дополнительные проблемы, связанные с точностью представления чисел в памяти и приведёт к необходимости значительно снизить скорость обучения сети, чтобы входы не обучились как пороговые. Потому приводите свои данные в соответствие с функцией активации и не забывайте об их представлении в оперативной памяти.
AnNEDoMini
25.10.2016 09:34По всей вероятности при операции умножения двух чисел [0,1] — будет число в том-же диапазоне, только за сложением надо следить.
alex4321
25.10.2016 13:33Скорее сравнимого порядка, не?
>>> a=0.0000000001
>>> a
1e-10
>>> b=100000
>>> for i in range(0, 10000):
… a+=b
…
>>> a-=10000*b
>>> a
0.0
lgorSL
25.10.2016 04:19+5Кошмары как-то не пугают, а вот последняя картинка с собакой действительно жутковато смотрится.
isden
25.10.2016 09:54-1Вот кстати, сколько картинок от DeepDream видел, везде все всегда сводится к собакам и глазам. Ну почему???
vc9ufi
25.10.2016 10:20Первую широко известную сеть учили на собаках. Этих собак почему-то постоянно вставляют в статьи о сетях и почему-то всегда находится кто-нибудь спрашивающий «почему собаки?».
killik
25.10.2016 10:23https://geektimes.ru/company/mailru/blog/281656/
«Эта способность объясняется тем, что распознавание изображения строится на входном наборе данных. В Deep Dream используется база ImageNet университетов Стэнфорда и Принстона, состоящая из 14 миллионов фотографий, проанализированных людьми. Но в Google использовали не все ресурсы ImageNet, а только каталог, содержащий классификацию 120 подклассов собак.
»
Mii
25.10.2016 13:31просто собака идеальный генератор серии картинок в кратчайшее время для изменения сознания, при этом ей самой эти состояния неизвестны и она это делает тупо за еду.
KonstantinSoloviov
25.10.2016 12:10Не жутко, а мерзко потому что — трипофобия. Тут недавно статья была так эту дурацкую картинку как КДПВ использовали. Нифига хорошего пока у нейросетей не выходит, так что пока генерим ужастики.
xtala
25.10.2016 11:15Когда я смотрю на картины нарисованные AI меня не покидает ощущение, что у машины шиза. Или как минимум биполярное расстройство. Перспектива восстания сумасшедших роботов как никогда реальна :)
RussDragon
25.10.2016 11:32Да, нейросеть взломает Ваш компьютер и профильтрует все фотографии с отдыха в Призме или Дипдриме, без бэкапа. Настоящий ужас ;)
xtala
25.10.2016 12:19Ну скажем взломать шифры ей не позволит царица всех наук математика, а вот перспектива оснащения боевых БПЛА и сторожевых турелей AI на основе нейросети по распознаванию лиц более чем реальна. И это пугает.
DROS
25.10.2016 15:00+1Когда они уже все наиграются с генерированием подобных картинок и займутся делом? Что не нейросеть, то сразу же надо показать какой треш она умеет генерить на основе фотографии. Какова практическая польза от этого? Я что-то просто не понимаю =(
hp6812er
25.10.2016 16:09+1Польза?
Мне просто понравился результат. А кто то захочет его повторить и возможно больше узнает о том, что есть такие нейросети. Популяризация науки.
NET_KOT
Прямо готовые обложки для музыкальных альбомов в стиле death metal. Или для книг Говарда Лавкрафта.
mypomacca
Или некоторым художникам станет легче зарабатывать на жизнь)