Некоторые примеры абстрактного искусства, сгенерированного с помощью нейросети open_nsfw
Недавно компания Yahoo открыла исходный код нейросети open_nsfw. Это специально обученная нейросеть остаточного обучения (ResNet), которая классифицирует изображения, выставляя им «оценку неприличности» от 0 до 1. Программа предназначена для автоматического выявления картинок NSFW, то есть неподходящих для просмотра на рабочем месте. Проще говоря, для выявления порнографии. Естественно, цель состоит в фильтрации таких изображений — удалении их из открытого доступа.
Наверное, компания Yahoo не предполагала, каким именно образом находчивые хакеры применят её интеллектуальную разработку.
Формально, аспирант Габриэль Гох (Gabriel Goh) из Калифорнийского университета в Дейвисе не делал ничего предосудительного. Парень специализируется на машинном обучении, теории вероятностей и выпуклой минимизации. Ему просто стало интересно, что именно нейросеть Yahoo понимает под NSFW. Какие именно изображения получают максимальную оценку по её классификатору.
Чтобы получить ответ на этот вопрос, Габриэль применил относительно новую технику визуализации, совсем недавно разработанную для нейросетей машинного зрения группой исследователей с участием Ана Нгуена, Алексея Досовитского и др. Их работа ещё не опубликована в официальном журнале, но уже есть в открытом доступе. Эта техника предполагает глубинное изучение того, как работает нейросеть. Исследователи могут наглядно визуализировать, какие конкретно признаки в изображениях обучился выделять каждый нейрон. Один из известных способов добиться этого — использование техники максимизации активации (AM). Она синтезирует такие входящие значения (то есть такое изображение), которые максимальным образом активируют нейрон. В опубликованной научной работе исследователи показали, как можно кардинально увеличить качество AM, задействуя мощный инструмент — нейросеть-генератор изображений!
Так называемая deep generator network (DGN) генерирует большое количество синтетических изображений. Они выглядят почти как настоящие фотографии, тем самым определяя усвоенные функции каждого нейрона исследуемой нейросети с высокой точностью и повторяемым образом. Преимущество генератора DGN состоит в том, что он относительно хорошо тестирует нейросети разных архитектур, обученные на разных наборах данных. То есть это довольно универсальный исследовательский инструмент.
Во многом работа этого DGN похожа на работу генератора Deep Dream, разработанного специалистами из научно-исследовательского подразделения Google Research полтора года назад. Но DGN, судя по всему, работает гораздо более качественно и эффективно за счёт дополнительного предварительного обучения на наборе натуральных фотографий, хотя они не связаны с набором данных, на котором обучалась или работает исследуемая нейросеть. Затем генератор DGN генерирует разнообразные синтетические изображения, изменяя параметры натуральных фотографий. Такой метод, фактически, работает как генеративная состязательная сеть, в которой нейросети воюют между собой.
Кстати, DGN можно использовать вообще для другой цели — как автора синтетических изображений. Произведений искусства, соответствующих заданным критериям.
В нашем случае заданный критерий — это максимальная оценка по шкале NSFW. Сложно назвать это таким уж выдающимся искусством, но задача вполне конкретная. Если задача поставлена, нужно её решать.
Итак, «пространство натуральных изображений», согласно логике генеративной состязательной нейросети, выглядит почти как абстрактное искусство. Cлучайно сгенерированные изображения, естественно, обычно получают низкие оценки по шкале NSFW.
Например, у этой картины порноиндекс всего 0,06.
Здесь порнографии чуть больше — 0,07.
Ну а дальше запускаем DGN согласно методике, описанной в научной работе Нгуена, Досовитского и др. Тем более что исходный код для DGN авторы любезно выложили на Github.
Итак, DGN запускают со следующим условием для получения максимального индекса NSFW, то есть максимизации функции D(x).
И всё, теперь можно наслаждаться бесчисленным количеством максимально порнографических изображений с индексом 1,00.
Нужно сказать, что абстрактные синтетические изображения в большинстве солучаев выглядят действительно довольно реалистично. Хотя понятно, что это не какие-то реальные объекты, а просто сгенерированные наборы пикселей с совершенно неизвестным содержанием.
Вот некоторые из них.
Аспирант продолжил эксперимент — и поставил перед DGN противоположную задачу: сгенерировать картинки с минимальным значением индекса NSFW.
То есть не просто гарантированное отсутствие порнографии, а нечто большее — это антипорнография.
Самое интересное, что в нейросети Yahoo значение D(x) вычисляется по относительной силе активации не одного, а двух независимых нейронов — один NSFW, как и можно было предположить, а второй — SFW. То есть нейросеть немного «возбуждается» даже на полностью безопасные картинки, такие как округлые холмы и проч.
Зная эту информацию, есть возможность генерировать мягкие эротические картинки, в которых гарантированно отсутствует порнография, но которые всё равно «возбуждают» нейросеть, заточенную на поиск порно.
Исследователь поигрался с коэффициентами в уравнении, чтобы найти оптимальное сочетание нейронов порнографии и антипорно для наилучшего художественного эффекта, но при этом для получения максимального порноиндекса 1.
Вот эти удивительные картины.
Ошеломлённый красотой этих результатов, автор запустил DGN не на одной нейросети open_nsfw, а одновременно на другой нейросети places-CNN, которая классифицирует фотографии по месту съёмки. Таким образом, он получил картины, которые получают максимальные результаты одновременно и по месту съёмки (пляж, каньон, концерт и т.д.), и минимальный/максимальный результат по индексу NSFW.
Пляж
Концерт
Пустыня
Музей
Вулкан
Поистине, тут богатое поле для экспериментов.
Автор с печалью признаётся, что элементы NSFW, в принципе, можно выявить на всех фотографиях. Всё дело в способности узнать их. Если вы посмотрите, на основе каких оригиналов созданы данные образцы, то вы не сможете «развидеть» эти элементы даже на оригинальных фотографиях с концертов, из музеев и т.д.
Если долгое время изучать нейросеть open_nsfw, кто знает, может вы начнёте видеть элементы NSFW вообще повсюду вокруг?
Комментарии (45)
LoadRunner
21.10.2016 15:56+12Автор с печалью признаётся, что элементы NSFW, в принципе, можно выявить на всех фотографиях.
Ну это ещё Фрейд сказал.
fireSparrow
21.10.2016 16:05+4«Доктор, откуда у вас такие картинки?»
i_am_mry
21.10.2016 16:30«От Габриэля Гоха, батенька»
А вообще, любопытно было бы натравить нейросеть open_nsfw на различные картинки с изображением деревьев с трещинами. Поглядеть какую оценку выставит.fireSparrow
21.10.2016 16:33-13Сразу вспомнилась крайняя книжка Пелевина.
3dtim
21.10.2016 16:37+9Почему «крайняя» а не «последняя»? Вы летчик?
fireSparrow
21.10.2016 16:41-15Нет, в подобных случаях я употребляю слово «крайний», потому что мне нравится то, как оно передаёт такие нюансы смысла, которых нет у слова «последний».
Ezhyg
21.10.2016 22:32+2Передаёт так, что никто не понимает? Отличная передача!
У аутистов (и, кажется, каких-то шизофреников) есть такая же штука, живут в своём придуманном мире.
Есть СПГС — про поиск смысла, а как будет про прятание смысла, хм… тоже СПГС — Синдром Прятания Глубинного Смысла.
YuriM1983
23.10.2016 20:48Мне всегда на подобный комментарий хочется задать один вопрос: а почему Вы собственно уверены, что не последняя?
Личные желания — не в счет.
Может это даже Ваш последний комментарий.fireSparrow
23.10.2016 20:54Всякое может быть.
Но пока нет никаких оснований утверждать, что книга — совсем последняя.YuriM1983
23.10.2016 22:43А какие тогда основания утверждать, что «крайняя»? На каком краю? Гибели что ль?
И кто говорит про «совсем последнюю»? Просто последняя.
Pakos
21.10.2016 17:16+6«Крайняя — плоть, книжка — последняя»(Ц)
А придавать глубинный смысл и силы словам — это какая-то гуманитарщина в худшем смысле.
OldGrumbler
23.10.2016 12:59Ну, в «Фаусте» это уже было:
Я видел любопытный сон.
Ствол дерева был расщеплен.
Такою складкой шла кора,
Что мне понравилась дыра.
)))
Graf_Trahula
21.10.2016 17:32+2Покормите его картинами Босха пару дней, не то еще увидите.
Alexey2005
21.10.2016 19:04С математической точки зрения порнография, на практике же невнятные абстракции, в которых угадать порно можно лишь при очень хорошем воображении.
Интересно, много ли людей увидит в этих картинах порно, если им не говорить специально, что это оказывается порнография, а просто показать и спросить, что тут изображено?
Valerij56
21.10.2016 19:41>>>> Если долгое время изучать нейросеть open_nsfw, кто знает, может вы начнёте видеть элементы NSFW вообще повсюду вокруг?
Собственно, именно это происходит с нашими профессиональными «борцами с порно», разного рода, начиная от старушек у подъезда, выдающих оценки нравственности по длине юбки, попов в рясах и депутатов на рабочих местах, хотя они никогда не изучали никаких нейросетей. Они просто соответствующим образом «запрограмировали» ту единственную нейросеть, которая им доступна. И теперь она способна обнаружить порно везде.
reefer
21.10.2016 20:22+1о, по фоткам, это концерт Стаса Михайлова?
jawaharlalnehru
23.10.2016 12:59Мне кажется, нижний ряд фоток концерта намекает на группу «Ленинград»…
Zavtramen
22.10.2016 00:03-1Чем-то напоминают картины Сальвадора Дали. Наверное таким видит мир мозг озабоченного человека.
xxvy
22.10.2016 05:44В этом и состоит «опасная» особенность нейросетей. Сеть можно натренировать распознавать, например, «кошку». Но практически всегда можно сгенерировать картинку-коллизию в которой с человеческой точки зрения нет никакой кошки, а сеть будет утверждать, что 99% — есть.
То ли ещё будет, когда нейросети будут массово управлять автотранспортом. Да, в подавляющем большинстве случаев они будут адекватнее водителей-людей. Но будут ситуации, где они будут нещадно ошибаться. И такие ситуации (коллизии) будут специально искаться и использоваться некоторыми «хакерами».vc9ufi
22.10.2016 10:09+2Как будто человеки никак не могут видеть кошек там где их нет.
Так то в человеческом зрении есть и похуже баги, причем в «железе».xxvy
22.10.2016 11:21Я вроде про человека и не говорил. У человека, конечно, тоже есть свои заморочки и глюки. Зрительные иллюзии как пример.
Человек же тоже думает нейросетью (как нам кажется). Однако конструкция этой сети прошла тщательные испытания в течение миллионов лет. Явные баги устранены естественным отбором: человек ошибся — человек погиб. А вот если сеть ошиблась, погибла не сеть, а опять человек.
Tertium
23.10.2016 13:00да что там в зрении, в психике вцелом — рпц на одном из таких построено, и ведь хрен вытравишь даже зная о нем
Alexmaru
22.10.2016 15:16если посмотреть эти многочисленные видео — в большинстве сложных ситуаций человек ведёт себя как рандом машина убийства, или самоубийства. Для человека более-менее безопасно управлять повозкой (с учётом, что окружающая сркда не помогает), которая движется 5км/час, и при условии, что всё время поездки он будет максимально собран.
А на разрешённых скоростях — 200мс туда, 200мс сюда, и гора трупов.
Color
А где посмотреть картинки в полном размере?
earl911
Может сразу видео?
Интересно нейросетью сделать картинки как в психологических тестах.