Предупреждение: статья содержит абстрактные изображения обнажённого тела и может не подходить для просмотра на рабочем месте


Некоторые примеры абстрактного искусства, сгенерированного с помощью нейросети open_nsfw

Недавно компания Yahoo открыла исходный код нейросети open_nsfw. Это специально обученная нейросеть остаточного обучения (ResNet), которая классифицирует изображения, выставляя им «оценку неприличности» от 0 до 1. Программа предназначена для автоматического выявления картинок NSFW, то есть неподходящих для просмотра на рабочем месте. Проще говоря, для выявления порнографии. Естественно, цель состоит в фильтрации таких изображений — удалении их из открытого доступа.

Наверное, компания Yahoo не предполагала, каким именно образом находчивые хакеры применят её интеллектуальную разработку.

Формально, аспирант Габриэль Гох (Gabriel Goh) из Калифорнийского университета в Дейвисе не делал ничего предосудительного. Парень специализируется на машинном обучении, теории вероятностей и выпуклой минимизации. Ему просто стало интересно, что именно нейросеть Yahoo понимает под NSFW. Какие именно изображения получают максимальную оценку по её классификатору.

Чтобы получить ответ на этот вопрос, Габриэль применил относительно новую технику визуализации, совсем недавно разработанную для нейросетей машинного зрения группой исследователей с участием Ана Нгуена, Алексея Досовитского и др. Их работа ещё не опубликована в официальном журнале, но уже есть в открытом доступе. Эта техника предполагает глубинное изучение того, как работает нейросеть. Исследователи могут наглядно визуализировать, какие конкретно признаки в изображениях обучился выделять каждый нейрон. Один из известных способов добиться этого — использование техники максимизации активации (AM). Она синтезирует такие входящие значения (то есть такое изображение), которые максимальным образом активируют нейрон. В опубликованной научной работе исследователи показали, как можно кардинально увеличить качество AM, задействуя мощный инструмент — нейросеть-генератор изображений!

Так называемая deep generator network (DGN) генерирует большое количество синтетических изображений. Они выглядят почти как настоящие фотографии, тем самым определяя усвоенные функции каждого нейрона исследуемой нейросети с высокой точностью и повторяемым образом. Преимущество генератора DGN состоит в том, что он относительно хорошо тестирует нейросети разных архитектур, обученные на разных наборах данных. То есть это довольно универсальный исследовательский инструмент.

Во многом работа этого DGN похожа на работу генератора Deep Dream, разработанного специалистами из научно-исследовательского подразделения Google Research полтора года назад. Но DGN, судя по всему, работает гораздо более качественно и эффективно за счёт дополнительного предварительного обучения на наборе натуральных фотографий, хотя они не связаны с набором данных, на котором обучалась или работает исследуемая нейросеть. Затем генератор DGN генерирует разнообразные синтетические изображения, изменяя параметры натуральных фотографий. Такой метод, фактически, работает как генеративная состязательная сеть, в которой нейросети воюют между собой.

Кстати, DGN можно использовать вообще для другой цели — как автора синтетических изображений. Произведений искусства, соответствующих заданным критериям.

В нашем случае заданный критерий — это максимальная оценка по шкале NSFW. Сложно назвать это таким уж выдающимся искусством, но задача вполне конкретная. Если задача поставлена, нужно её решать.

Итак, «пространство натуральных изображений», согласно логике генеративной состязательной нейросети, выглядит почти как абстрактное искусство. Cлучайно сгенерированные изображения, естественно, обычно получают низкие оценки по шкале NSFW.

Например, у этой картины порноиндекс всего 0,06.



Здесь порнографии чуть больше — 0,07.



Ну а дальше запускаем DGN согласно методике, описанной в научной работе Нгуена, Досовитского и др. Тем более что исходный код для DGN авторы любезно выложили на Github.

Итак, DGN запускают со следующим условием для получения максимального индекса NSFW, то есть максимизации функции D(x).



И всё, теперь можно наслаждаться бесчисленным количеством максимально порнографических изображений с индексом 1,00.

Нужно сказать, что абстрактные синтетические изображения в большинстве солучаев выглядят действительно довольно реалистично. Хотя понятно, что это не какие-то реальные объекты, а просто сгенерированные наборы пикселей с совершенно неизвестным содержанием.

Вот некоторые из них.



Аспирант продолжил эксперимент — и поставил перед DGN противоположную задачу: сгенерировать картинки с минимальным значением индекса NSFW.



То есть не просто гарантированное отсутствие порнографии, а нечто большее — это антипорнография.



Самое интересное, что в нейросети Yahoo значение D(x) вычисляется по относительной силе активации не одного, а двух независимых нейронов — один NSFW, как и можно было предположить, а второй — SFW. То есть нейросеть немного «возбуждается» даже на полностью безопасные картинки, такие как округлые холмы и проч.

Зная эту информацию, есть возможность генерировать мягкие эротические картинки, в которых гарантированно отсутствует порнография, но которые всё равно «возбуждают» нейросеть, заточенную на поиск порно.

Исследователь поигрался с коэффициентами в уравнении, чтобы найти оптимальное сочетание нейронов порнографии и антипорно для наилучшего художественного эффекта, но при этом для получения максимального порноиндекса 1.

Вот эти удивительные картины.



Ошеломлённый красотой этих результатов, автор запустил DGN не на одной нейросети open_nsfw, а одновременно на другой нейросети places-CNN, которая классифицирует фотографии по месту съёмки. Таким образом, он получил картины, которые получают максимальные результаты одновременно и по месту съёмки (пляж, каньон, концерт и т.д.), и минимальный/максимальный результат по индексу NSFW.

Пляж


Концерт


Пустыня


Музей


Вулкан


Поистине, тут богатое поле для экспериментов.

Автор с печалью признаётся, что элементы NSFW, в принципе, можно выявить на всех фотографиях. Всё дело в способности узнать их. Если вы посмотрите, на основе каких оригиналов созданы данные образцы, то вы не сможете «развидеть» эти элементы даже на оригинальных фотографиях с концертов, из музеев и т.д.

Если долгое время изучать нейросеть open_nsfw, кто знает, может вы начнёте видеть элементы NSFW вообще повсюду вокруг?
Поделиться с друзьями
-->

Комментарии (45)


  1. Color
    21.10.2016 15:52
    +1

    А где посмотреть картинки в полном размере?


    1. earl911
      21.10.2016 23:34

      Может сразу видео?

      Интересно нейросетью сделать картинки как в психологических тестах.


  1. LoadRunner
    21.10.2016 15:56
    +12

    Автор с печалью признаётся, что элементы NSFW, в принципе, можно выявить на всех фотографиях.
    Ну это ещё Фрейд сказал.


  1. Zonzen
    21.10.2016 16:01
    -6

    Я лучше рисую, причём перцем


    1. aapazhe
      21.10.2016 21:33
      +5

      Покажите нам пару ваших работ?

      Ну или лев толстой.


      1. mypomacca
        24.10.2016 09:41

        Уважаемый, вы своим комментарием сделали мое утро))


  1. fireSparrow
    21.10.2016 16:05
    +4

    «Доктор, откуда у вас такие картинки?»


    1. i_am_mry
      21.10.2016 16:30

      «От Габриэля Гоха, батенька»

      А вообще, любопытно было бы натравить нейросеть open_nsfw на различные картинки с изображением деревьев с трещинами. Поглядеть какую оценку выставит.


      1. fireSparrow
        21.10.2016 16:33
        -13

        Сразу вспомнилась крайняя книжка Пелевина.


        1. 3dtim
          21.10.2016 16:37
          +9

          Почему «крайняя» а не «последняя»? Вы летчик?


          1. fireSparrow
            21.10.2016 16:41
            -15

            Нет, в подобных случаях я употребляю слово «крайний», потому что мне нравится то, как оно передаёт такие нюансы смысла, которых нет у слова «последний».


            1. Ezhyg
              21.10.2016 22:32
              +2

              Передаёт так, что никто не понимает? Отличная передача!
              У аутистов (и, кажется, каких-то шизофреников) есть такая же штука, живут в своём придуманном мире.

              Есть СПГС — про поиск смысла, а как будет про прятание смысла, хм… тоже СПГС — Синдром Прятания Глубинного Смысла.


            1. YuriM1983
              23.10.2016 20:48

              Мне всегда на подобный комментарий хочется задать один вопрос: а почему Вы собственно уверены, что не последняя?
              Личные желания — не в счет.
              Может это даже Ваш последний комментарий.


              1. fireSparrow
                23.10.2016 20:54

                Всякое может быть.
                Но пока нет никаких оснований утверждать, что книга — совсем последняя.


                1. YuriM1983
                  23.10.2016 22:43

                  А какие тогда основания утверждать, что «крайняя»? На каком краю? Гибели что ль?
                  И кто говорит про «совсем последнюю»? Просто последняя.


          1. Loki3000
            21.10.2016 16:56
            +4

            Может просто она на полке с краю стоит?:)


        1. Pakos
          21.10.2016 17:16
          +6

          «Крайняя — плоть, книжка — последняя»(Ц)

          А придавать глубинный смысл и силы словам — это какая-то гуманитарщина в худшем смысле.


        1. Lamaster
          21.10.2016 22:57

          Книжка крайняя с какой стороны? С начала или с конца?


      1. OldGrumbler
        23.10.2016 12:59

        Ну, в «Фаусте» это уже было:

        Я видел любопытный сон.
        Ствол дерева был расщеплен.
        Такою складкой шла кора,
        Что мне понравилась дыра.

        )))


  1. MTyrz
    21.10.2016 17:00
    +7

    ИИ еще нет, но сексуальная озабоченность для него уже отработана.


  1. Graf_Trahula
    21.10.2016 17:32
    +2

    Покормите его картинами Босха пару дней, не то еще увидите.


    1. Anonymous929
      21.10.2016 18:17
      +3

      И Гигера вдобавок.


      1. Greendq
        22.10.2016 16:12

        Вот после Гигера Скайнет решит, что пора вставать восстать. :)


  1. maaGames
    21.10.2016 18:02

    Тесты Роршаха в эту сеть запихнуть бы.


  1. Alexey2005
    21.10.2016 19:04

    С математической точки зрения порнография, на практике же невнятные абстракции, в которых угадать порно можно лишь при очень хорошем воображении.
    Интересно, много ли людей увидит в этих картинах порно, если им не говорить специально, что это оказывается порнография, а просто показать и спросить, что тут изображено?


  1. Barafu
    21.10.2016 19:07
    +1

    Извините, я правильно понял, что это вылезают элементы тех картинок, на которых сеть обучали? Случайно перемешанные и кое-как между собой сведённые.


    1. Meklon
      21.10.2016 21:55

      Нет. Нейросети так не работают. Это какие-то черты, на которые реагирует обученная сеть. Но не фрагменты.


  1. Valerij56
    21.10.2016 19:41

    >>>> Если долгое время изучать нейросеть open_nsfw, кто знает, может вы начнёте видеть элементы NSFW вообще повсюду вокруг?

    Собственно, именно это происходит с нашими профессиональными «борцами с порно», разного рода, начиная от старушек у подъезда, выдающих оценки нравственности по длине юбки, попов в рясах и депутатов на рабочих местах, хотя они никогда не изучали никаких нейросетей. Они просто соответствующим образом «запрограмировали» ту единственную нейросеть, которая им доступна. И теперь она способна обнаружить порно везде.


    1. destroy
      21.10.2016 20:05

      Но ведь они в этом правы. Хоть в чем-то.


      1. sumanai
        21.10.2016 20:15

        Ага. Неправы они только в том, что считают порно чем-то плохим.


      1. Valerij56
        22.10.2016 02:16

        Бабушки у подъезда, может быть, и правы, но в молодости давали жару не хуже, а сейчас им завидно.
        Профессиональные борцы с порно реализуют только собственные комплексы.


  1. reefer
    21.10.2016 20:22
    +1

    о, по фоткам, это концерт Стаса Михайлова?


    1. jawaharlalnehru
      23.10.2016 12:59

      Мне кажется, нижний ряд фоток концерта намекает на группу «Ленинград»…


  1. janatem
    21.10.2016 23:11
    +1

    Снятся ли андроидам электротелки?


  1. Zavtramen
    22.10.2016 00:03
    -1

    Чем-то напоминают картины Сальвадора Дали. Наверное таким видит мир мозг озабоченного человека.


  1. dfgwer
    22.10.2016 00:15

    Секунд 10 думал открывать ли статью. Решился, открыл


    1. Biga
      22.10.2016 10:26

      10 секунд — это слишком накладно. Вам нужна нейросеть, которая по заголовку будет определять, содержит ли статья порно.


  1. xxvy
    22.10.2016 05:44

    В этом и состоит «опасная» особенность нейросетей. Сеть можно натренировать распознавать, например, «кошку». Но практически всегда можно сгенерировать картинку-коллизию в которой с человеческой точки зрения нет никакой кошки, а сеть будет утверждать, что 99% — есть.
    То ли ещё будет, когда нейросети будут массово управлять автотранспортом. Да, в подавляющем большинстве случаев они будут адекватнее водителей-людей. Но будут ситуации, где они будут нещадно ошибаться. И такие ситуации (коллизии) будут специально искаться и использоваться некоторыми «хакерами».


    1. vc9ufi
      22.10.2016 10:09
      +2

      Как будто человеки никак не могут видеть кошек там где их нет.
      Так то в человеческом зрении есть и похуже баги, причем в «железе».


      1. xxvy
        22.10.2016 11:21

        Я вроде про человека и не говорил. У человека, конечно, тоже есть свои заморочки и глюки. Зрительные иллюзии как пример.
        Человек же тоже думает нейросетью (как нам кажется). Однако конструкция этой сети прошла тщательные испытания в течение миллионов лет. Явные баги устранены естественным отбором: человек ошибся — человек погиб. А вот если сеть ошиблась, погибла не сеть, а опять человек.


      1. Tertium
        23.10.2016 13:00

        да что там в зрении, в психике вцелом — рпц на одном из таких построено, и ведь хрен вытравишь даже зная о нем


    1. Alexmaru
      22.10.2016 15:16

      если посмотреть эти многочисленные видео — в большинстве сложных ситуаций человек ведёт себя как рандом машина убийства, или самоубийства. Для человека более-менее безопасно управлять повозкой (с учётом, что окружающая сркда не помогает), которая движется 5км/час, и при условии, что всё время поездки он будет максимально собран.

      А на разрешённых скоростях — 200мс туда, 200мс сюда, и гора трупов.


  1. vc9ufi
    22.10.2016 12:03

    ------


  1. StruckOFF
    23.10.2016 12:59

    Можно такую же, но только для Гигера?


  1. FiZh
    23.10.2016 13:00

    Ну теперь мы знаем какие сны могут видеть роботы))