Генерация художественных картин в нейросети, обученной для распознавания порно / forpes.ru

Главная
Генерация художественных картин в нейросети, обученной для распознавания порно

Генерация художественных картин в нейросети, обученной для распознавания порно +38

21.10.2016 12:44

alizar 45 31700 Источник

Предупреждение: статья содержит абстрактные изображения обнажённого тела и может не подходить для просмотра на рабочем месте

Некоторые примеры абстрактного искусства, сгенерированного с помощью нейросети open_nsfw

Недавно компания Yahoo открыла исходный код нейросети open_nsfw. Это специально обученная нейросеть остаточного обучения (ResNet), которая классифицирует изображения, выставляя им «оценку неприличности» от 0 до 1. Программа предназначена для автоматического выявления картинок NSFW, то есть неподходящих для просмотра на рабочем месте. Проще говоря, для выявления порнографии. Естественно, цель состоит в фильтрации таких изображений — удалении их из открытого доступа.

Наверное, компания Yahoo не предполагала, каким именно образом находчивые хакеры применят её интеллектуальную разработку.

Формально, аспирант Габриэль Гох (Gabriel Goh) из Калифорнийского университета в Дейвисе не делал ничего предосудительного. Парень специализируется на машинном обучении, теории вероятностей и выпуклой минимизации. Ему просто стало интересно, что именно нейросеть Yahoo понимает под NSFW. Какие именно изображения получают максимальную оценку по её классификатору.

Чтобы получить ответ на этот вопрос, Габриэль применил относительно новую технику визуализации, совсем недавно разработанную для нейросетей машинного зрения группой исследователей с участием Ана Нгуена, Алексея Досовитского и др. Их работа ещё не опубликована в официальном журнале, но уже есть в открытом доступе. Эта техника предполагает глубинное изучение того, как работает нейросеть. Исследователи могут наглядно визуализировать, какие конкретно признаки в изображениях обучился выделять каждый нейрон. Один из известных способов добиться этого — использование техники максимизации активации (AM). Она синтезирует такие входящие значения (то есть такое изображение), которые максимальным образом активируют нейрон. В опубликованной научной работе исследователи показали, как можно кардинально увеличить качество AM, задействуя мощный инструмент — нейросеть-генератор изображений!

Так называемая deep generator network (DGN) генерирует большое количество синтетических изображений. Они выглядят почти как настоящие фотографии, тем самым определяя усвоенные функции каждого нейрона исследуемой нейросети с высокой точностью и повторяемым образом. Преимущество генератора DGN состоит в том, что он относительно хорошо тестирует нейросети разных архитектур, обученные на разных наборах данных. То есть это довольно универсальный исследовательский инструмент.

Во многом работа этого DGN похожа на работу генератора Deep Dream, разработанного специалистами из научно-исследовательского подразделения Google Research полтора года назад. Но DGN, судя по всему, работает гораздо более качественно и эффективно за счёт дополнительного предварительного обучения на наборе натуральных фотографий, хотя они не связаны с набором данных, на котором обучалась или работает исследуемая нейросеть. Затем генератор DGN генерирует разнообразные синтетические изображения, изменяя параметры натуральных фотографий. Такой метод, фактически, работает как генеративная состязательная сеть, в которой нейросети воюют между собой.

Кстати, DGN можно использовать вообще для другой цели — как автора синтетических изображений. Произведений искусства, соответствующих заданным критериям.

В нашем случае заданный критерий — это максимальная оценка по шкале NSFW. Сложно назвать это таким уж выдающимся искусством, но задача вполне конкретная. Если задача поставлена, нужно её решать.

Итак, «пространство натуральных изображений», согласно логике генеративной состязательной нейросети, выглядит почти как абстрактное искусство. Cлучайно сгенерированные изображения, естественно, обычно получают низкие оценки по шкале NSFW.

Например, у этой картины порноиндекс всего 0,06.

Здесь порнографии чуть больше — 0,07.

Ну а дальше запускаем DGN согласно методике, описанной в научной работе Нгуена, Досовитского и др. Тем более что исходный код для DGN авторы любезно выложили на Github.

Итак, DGN запускают со следующим условием для получения максимального индекса NSFW, то есть максимизации функции D(x).

И всё, теперь можно наслаждаться бесчисленным количеством максимально порнографических изображений с индексом 1,00.

Нужно сказать, что абстрактные синтетические изображения в большинстве солучаев выглядят действительно довольно реалистично. Хотя понятно, что это не какие-то реальные объекты, а просто сгенерированные наборы пикселей с совершенно неизвестным содержанием.

Вот некоторые из них.

Аспирант продолжил эксперимент — и поставил перед DGN противоположную задачу: сгенерировать картинки с минимальным значением индекса NSFW.

То есть не просто гарантированное отсутствие порнографии, а нечто большее — это антипорнография.

Самое интересное, что в нейросети Yahoo значение D(x) вычисляется по относительной силе активации не одного, а двух независимых нейронов — один NSFW, как и можно было предположить, а второй — SFW. То есть нейросеть немного «возбуждается» даже на полностью безопасные картинки, такие как округлые холмы и проч.

Зная эту информацию, есть возможность генерировать мягкие эротические картинки, в которых гарантированно отсутствует порнография, но которые всё равно «возбуждают» нейросеть, заточенную на поиск порно.

Исследователь поигрался с коэффициентами в уравнении, чтобы найти оптимальное сочетание нейронов порнографии и антипорно для наилучшего художественного эффекта, но при этом для получения максимального порноиндекса 1.

Вот эти удивительные картины.

Ошеломлённый красотой этих результатов, автор запустил DGN не на одной нейросети open_nsfw, а одновременно на другой нейросети places-CNN, которая классифицирует фотографии по месту съёмки. Таким образом, он получил картины, которые получают максимальные результаты одновременно и по месту съёмки (пляж, каньон, концерт и т.д.), и минимальный/максимальный результат по индексу NSFW.

Пляж

Концерт

Пустыня

Музей

Вулкан

Поистине, тут богатое поле для экспериментов.

Автор с печалью признаётся, что элементы NSFW, в принципе, можно выявить на всех фотографиях. Всё дело в способности узнать их. Если вы посмотрите, на основе каких оригиналов созданы данные образцы, то вы не сможете «развидеть» эти элементы даже на оригинальных фотографиях с концертов, из музеев и т.д.

Если долгое время изучать нейросеть open_nsfw, кто знает, может вы начнёте видеть элементы NSFW вообще повсюду вокруг?

Поделиться с друзьями

-->

Комментарии (45)

Color
21.10.2016 15:52
#9643960
+1
А где посмотреть картинки в полном размере?
1. earl911
  21.10.2016 23:34
  #9644900
  Может сразу видео?
  
  Интересно нейросетью сделать картинки как в психологических тестах.

LoadRunner
21.10.2016 15:56
#9643990
+12
Автор с печалью признаётся, что элементы NSFW, в принципе, можно выявить на всех фотографиях.
Ну это ещё Фрейд сказал.

Zonzen
21.10.2016 16:01
#9644004
-6
Я лучше рисую, причём перцем
1. aapazhe
  21.10.2016 21:33
  #9644734
  +5
  Покажите нам пару ваших работ?
  
  Ну или лев толстой.
  1. mypomacca
    24.10.2016 09:41
    #9647120
    Уважаемый, вы своим комментарием сделали мое утро))

fireSparrow
21.10.2016 16:05
#9644012
+4
«Доктор, откуда у вас такие картинки?»
1. i_am_mry
  21.10.2016 16:30
  #9644076
  «От Габриэля Гоха, батенька»
  
  А вообще, любопытно было бы натравить нейросеть open_nsfw на различные картинки с изображением деревьев с трещинами. Поглядеть какую оценку выставит.
  1. fireSparrow
    21.10.2016 16:33
    #9644086
    -13
    Сразу вспомнилась крайняя книжка Пелевина.
    
    3dtim
    21.10.2016 16:37
    #9644094
    +9
    Почему «крайняя» а не «последняя»? Вы летчик?
    
    fireSparrow
    21.10.2016 16:41
    #9644102
    -15
    Нет, в подобных случаях я употребляю слово «крайний», потому что мне нравится то, как оно передаёт такие нюансы смысла, которых нет у слова «последний».
    
    Ezhyg
    21.10.2016 22:32
    #9644808
    +2
    Передаёт так, что никто не понимает? Отличная передача!
    У аутистов (и, кажется, каких-то шизофреников) есть такая же штука, живут в своём придуманном мире.
    
    Есть СПГС — про поиск смысла, а как будет про прятание смысла, хм… тоже СПГС — Синдром Прятания Глубинного Смысла.
    
    YuriM1983
    23.10.2016 20:48
    #9646710
    Мне всегда на подобный комментарий хочется задать один вопрос: а почему Вы собственно уверены, что не последняя?
    Личные желания — не в счет.
    Может это даже Ваш последний комментарий.
    
    fireSparrow
    23.10.2016 20:54
    #9646714
    Всякое может быть.
    Но пока нет никаких оснований утверждать, что книга — совсем последняя.
    
    YuriM1983
    23.10.2016 22:43
    #9646808
    А какие тогда основания утверждать, что «крайняя»? На каком краю? Гибели что ль?
    И кто говорит про «совсем последнюю»? Просто последняя.
    
    Loki3000
    21.10.2016 16:56
    #9644158
    +4
    Может просто она на полке с краю стоит?:)
    
    Pakos
    21.10.2016 17:16
    #9644200
    +6
    «Крайняя — плоть, книжка — последняя»(Ц)
    
    А придавать глубинный смысл и силы словам — это какая-то гуманитарщина в худшем смысле.
    
    Lamaster
    21.10.2016 22:57
    #9644830
    Книжка крайняя с какой стороны? С начала или с конца?
  1. OldGrumbler
    23.10.2016 12:59
    #9646422
    Ну, в «Фаусте» это уже было:
    
    Я видел любопытный сон.
    Ствол дерева был расщеплен.
    Такою складкой шла кора,
    Что мне понравилась дыра.
    
    )))

MTyrz
21.10.2016 17:00
#9644166
+7
ИИ еще нет, но сексуальная озабоченность для него уже отработана.

Graf_Trahula
21.10.2016 17:32
#9644250
+2
Покормите его картинами Босха пару дней, не то еще увидите.
1. Anonymous929
  21.10.2016 18:17
  #9644382
  +3
  И Гигера вдобавок.
  1. Greendq
    22.10.2016 16:12
    #9645712
    Вот после Гигера Скайнет решит, что пора ~~вставать~~ восстать. :)

maaGames
21.10.2016 18:02
#9644336
Тесты Роршаха в эту сеть запихнуть бы.

Alexey2005
21.10.2016 19:04
#9644484
С математической точки зрения порнография, на практике же невнятные абстракции, в которых угадать порно можно лишь при очень хорошем воображении.
Интересно, много ли людей увидит в этих картинах порно, если им не говорить специально, что это оказывается порнография, а просто показать и спросить, что тут изображено?

Barafu
21.10.2016 19:07
#9644494
+1
Извините, я правильно понял, что это вылезают элементы тех картинок, на которых сеть обучали? Случайно перемешанные и кое-как между собой сведённые.
1. Meklon
  21.10.2016 21:55
  #9644768
  Нет. Нейросети так не работают. Это какие-то черты, на которые реагирует обученная сеть. Но не фрагменты.

Valerij56
21.10.2016 19:41
#9644536
>>>> Если долгое время изучать нейросеть open_nsfw, кто знает, может вы начнёте видеть элементы NSFW вообще повсюду вокруг?

Собственно, именно это происходит с нашими профессиональными «борцами с порно», разного рода, начиная от старушек у подъезда, выдающих оценки нравственности по длине юбки, попов в рясах и депутатов на рабочих местах, хотя они никогда не изучали никаких нейросетей. Они просто соответствующим образом «запрограмировали» ту единственную нейросеть, которая им доступна. И теперь она способна обнаружить порно везде.
1. destroy
  21.10.2016 20:05
  #9644574
  Но ведь они в этом правы. Хоть в чем-то.
  1. sumanai
    21.10.2016 20:15
    #9644588
    Ага. Неправы они только в том, что считают порно чем-то плохим.
  1. Valerij56
    22.10.2016 02:16
    #9645110
    Бабушки у подъезда, может быть, и правы, но в молодости давали жару не хуже, а сейчас им завидно.
    Профессиональные борцы с порно реализуют только собственные комплексы.

reefer
21.10.2016 20:22
#9644612
+1
о, по фоткам, это концерт Стаса Михайлова?
1. jawaharlalnehru
  23.10.2016 12:59
  #9646424
  Мне кажется, нижний ряд фоток концерта намекает на группу «Ленинград»…

janatem
21.10.2016 23:11
#9644860
+1
Снятся ли андроидам электротелки?

Zavtramen
22.10.2016 00:03
#9644946
-1
Чем-то напоминают картины Сальвадора Дали. Наверное таким видит мир мозг озабоченного человека.

dfgwer
22.10.2016 00:15
#9644968
Секунд 10 думал открывать ли статью. Решился, открыл
1. Biga
  22.10.2016 10:26
  #9645340
  10 секунд — это слишком накладно. Вам нужна нейросеть, которая по заголовку будет определять, содержит ли статья порно.

xxvy
22.10.2016 05:44
#9645182
В этом и состоит «опасная» особенность нейросетей. Сеть можно натренировать распознавать, например, «кошку». Но практически всегда можно сгенерировать картинку-коллизию в которой с человеческой точки зрения нет никакой кошки, а сеть будет утверждать, что 99% — есть.
То ли ещё будет, когда нейросети будут массово управлять автотранспортом. Да, в подавляющем большинстве случаев они будут адекватнее водителей-людей. Но будут ситуации, где они будут нещадно ошибаться. И такие ситуации (коллизии) будут специально искаться и использоваться некоторыми «хакерами».
1. vc9ufi
  22.10.2016 10:09
  #9645314
  +2
  Как будто человеки никак не могут видеть кошек там где их нет.
  Так то в человеческом зрении есть и похуже баги, причем в «железе».
  1. xxvy
    22.10.2016 11:21
    #9645386
    Я вроде про человека и не говорил. У человека, конечно, тоже есть свои заморочки и глюки. Зрительные иллюзии как пример.
    Человек же тоже думает нейросетью (как нам кажется). Однако конструкция этой сети прошла тщательные испытания в течение миллионов лет. Явные баги устранены естественным отбором: человек ошибся — человек погиб. А вот если сеть ошиблась, погибла не сеть, а опять человек.
  1. Tertium
    23.10.2016 13:00
    #9646440
    да что там в зрении, в психике вцелом — рпц на одном из таких построено, и ведь хрен вытравишь даже зная о нем
1. Alexmaru
  22.10.2016 15:16
  #9645668
  если посмотреть эти многочисленные видео — в большинстве сложных ситуаций человек ведёт себя как рандом машина убийства, или самоубийства. Для человека более-менее безопасно управлять повозкой (с учётом, что окружающая сркда не помогает), которая движется 5км/час, и при условии, что всё время поездки он будет максимально собран.
  
  А на разрешённых скоростях — 200мс туда, 200мс сюда, и гора трупов.

vc9ufi
22.10.2016 12:03
#9645434
------

StruckOFF
23.10.2016 12:59
#9646420
Можно такую же, но только для Гигера?

FiZh
23.10.2016 13:00
#9646436
Ну теперь мы знаем какие сны могут видеть роботы))