От переводчика: Этот забавный репозиторий уже с неделю находится в трендах гитхаба, и сейчас у него фееричное количество из 5000 звёздочек и 400 форков — поэтому я подумал, что было бы интересно перевести про него статью, хотя она короткая, да и тематика для хабра не очень стандартная.
Если интересно, в оригинале статьи (ссылка около заголовка) есть ссылки на примеры работы программы.

В Японии порнографические изображения с пенисами и вагинами считаются нелегальными. С начала 1980ых годов сотни людей были арестованы за распространение в сети подобных материалов.


Для того, чтобы обойти этот запрет, художники, рисующие хентай (порнографический жанр аниме и манги), обычно рисуют небольшие полоски или размытие там, где находится запретный контент. Получается, что авторы часто вкладывают много усилий в изображения гениталий, которые никогда не увидят свет в Японии (примечание переводчика: да, именно так это в оригинале и звучит).


Для того, чтобы восстановить изображения, исследователь машинного обучения под ником “Deeppomf” написал алгоритм, который использует нейронные сети для обхода цензуры. Он назвал свою программу DeepCreamPy.


Кто угодно может скачать код и попробовать эту программу — она получила большую известность на Reddit, и некоторые выкладывали там же изображения, которые у них получились в результате обработки. За неделю программа набрала свыше 500 загрузок.


На данный момент DeepCreamPy может убирать цензуру на иллюстрациях с пенисов и вагин. Она пока что не работает на видео, сосках и анусах. Перед запуском программы пользователю нужно просто отметить зелёным цветом соответствующую зону на изображении.


Deeppomf писал мне в емейле, что создание DeepCreamPy является ответом на десятилетия цензуры хентая японским правительством. Статья 175 Уголовного Кодекса Японии запрещает распространение “непристойных” материалов (и хентай явно подпадает под эту категорию) и требует, чтобы порнография была хотя бы частично закрашена чёрными полосками или мозаикой с размытием.


“DeepCreamPy сделана для того, чтобы противодействовать усиливающейся цензуре” — сказал Deeppomf. “Японское правительство, в особенности Верховный Суд Японии, показывает, что они не собираются смягчать свои требования. Так что перемены должны прийти извне”.


Он начал думать о проекте ещё летом 2016, но говорит, что не был первым в идее использовать нейронные сети для убирания цензуры.


“Но я был первым, кто оказался достаточно мотивированным для того, чтобы реализовать эту идею, достаточно умелым, чтобы собрать данные и натренировать нейронную сеть, и недостаточно карьеро-ориентированным, чтобы работать над чем-то, что лучше подошло бы к моему резюме” — так же добавил он.


Всего за несколько месяцев Deeppomf собрал выборку из более чем 100.000 хентайных изображений без цензуры для тренировки алгоритма. Выборка включает яой, юри, фута и “другие фетиши”, как он сказал. Гуро и порнография с фекальной тематикой не были включены в выборку, поскольку могли привести к нежелательным результатам.


“Я не собирал собственную коллекцию порно, поэтому мои персональные пристрастия не имеют значения. Я не видел более 95 процентов изображений, потому что изучать каждое было бы слишком долго” — прокомментировал Deeppomf.


Пока что алгоритм не всегда производит корректные результаты — по крайней мере, на тех примерах, которые предоставляли пользователи — чёрные полоски убираются достаточно легко, но с мозаикой есть проблемы. Впрочем, Deeppomf продолжает совершенствовать алгоритм, а так же хочет добавить туда новый интерфейс и возможность работы с чёрно-белыми изображениями.


“Искусственный интеллект только начал пенетрировать индустрию порно” — говорит Deeppomf. “То ли ещё будет”.


Ссылки


Комментарии (72)


  1. jehy Автор
    06.11.2018 12:49

    Не стал добавлять в статью, но в тему о том «как AI пенетрирует порно идустрию» — чудесная другая статья на хабре «Как AI вставляет Николаса Кейджа в фильмы и делает порно со знаменитостями». Мопед не мой, но рекомендую, если пропустили.


  1. atomlib
    06.11.2018 13:03

    Работать-то работает, но остаются непонятные зелёные разводы.

    Зацензурено


    1. jehy Автор
      06.11.2018 14:01

      Возможно, в обучающей выборке было слишком мало эклеров.


    1. NetBUG
      06.11.2018 14:52

      Код открытый, данные открытые. Дообучи декодер и выложи


      1. atomlib
        06.11.2018 15:52

        Дело не в модели, а в том, что зелёным цветом для программы помечаются зацензуренные места. Сама она их не ищет.


  1. KevlarBeaver
    06.11.2018 13:08
    +1

    Нельзя распространять порнографию, но можно распространять алгоритмы, создающие порнографию.


    1. Alexey2005
      06.11.2018 13:32

      Просто до политиков пока не дошло, что оказывается порно можно создавать по каким-то там алгоритмам. Лет через 5-6, когда технология станет массовой, запретят и её.


      1. Brenwen
        06.11.2018 16:18

        Лет через 5 нейросеть будет сама рисовать порно по ключевым словам. А через 10 — еще и видео генерировать по текстовому сценарию.


        1. klubben
          07.11.2018 03:59
          +1

          А еще через пять — генерировать законы которые все это запрещают


          1. mSnus
            07.11.2018 10:24

            А сейчас что, не так?


        1. KodyWiremane
          07.11.2018 19:04

          Порнодемосцена. Полнометражка для взрослых в 64 Кб.


      1. maksim_ms
        07.11.2018 18:58

        Как бы из-за «по каким-то там алгоритмам» их все не запретили)
        Правительству они и так не нужны, оно без них работает)


    1. 0xd34df00d
      06.11.2018 16:28

      Достаточно сделать тьюринг-полный видеокодек, и можно будет совсем не париться.


      1. Alexey2005
        06.11.2018 20:55
        +5

        Говорят, в древние времена что-то такое существовало. По крайней мере, первые выпуски «Масяни» и «Магазинчика Бо» удивительным образом влезали на 1.44 дискетку. Более того, сам «кодек» мог быть завёрнут в exe вместе со всем роликом, и это всё ещё влезало на дискетку!
        Вот это был кодек так кодек, JS+Canvas по сравнению с этим просто костыльное, кривое, прожорливое, раздутое убожество.


        1. SelenIT3
          07.11.2018 11:17

          Масяня и «магазинчик» же векторные были, их скорее можно сравнивать с SVG + @keyframes...


        1. Navij
          07.11.2018 11:18

          Но ведь Масяня и Бо были векторными, не?


        1. AlexxFFC
          07.11.2018 13:35

          И называлось это Flash? :)


  1. aszhitarev
    06.11.2018 13:17
    +2

    Ну хоть кто-то делом занят!


  1. Popadanec
    06.11.2018 13:30
    +3

    Как всегда. Порно двигатель прогресса.


    1. jehy Автор
      06.11.2018 13:36

      Как ни странно — да. На реддите это активно обсуждают, материала ещё на полноценную статью…


    1. Viacheslav01
      07.11.2018 02:10

      Война и порно, да именно так!


      1. Popadanec
        07.11.2018 14:30

        Тогда уж первопричины: Зависть и Лень.


  1. Mimus_spb
    06.11.2018 13:40
    +1

    Господи, ты услышал мои молитвы


  1. Barafu_Albino_Cheetah
    06.11.2018 13:48
    +1

    Всякий раз, когда вижу стоны по вопросам обязательного замыливания, не важно, лиц или других частей тела, думаю: почему не сделают алгоритм, обеспечивающий детерминированную генерацию квадративков с сохранением большей части информации? То есть смотришь глазами — картинки нет, а специальный алгоритм без проблем восстанавливает всё «как было».
    Пример алгоритма: внутри квадратной области, скажем, 16*16, перемешиваем пиксели местами по определённому и обратимому способу. Затем, чтобы не получилось яркое пятно, все три канала цвета смещаем к белому или чёрному, а значение смещения прописываем в неиспользуемый альфа-канал. И всё.


    1. Taraflex
      06.11.2018 14:31

      обеспечивающий детерминированную генерацию квадративков с сохранением большей части информации?

      Потому что это никому не нужно?
      А для простого размытия по гауссу и так есть куча наработок.
      habr.com/post/152885
      habr.com/post/136853
      habr.com/post/324052
      habr.com/post/147828
      habr.com/post/424987
      habr.com/post/130198


    1. servermen
      06.11.2018 14:37

      Мысль неплохая!


    1. Ocelot
      06.11.2018 15:15
      +1

      Один мой знакомый видел плашки, в которых был просто инвертирован цвет.


    1. Sklott
      06.11.2018 15:18
      +1

      Давно сделали. Очень давно находил программку для «кодирования»/«декодирования» такой цензуры и именно для японии. Там даже было несколько алгоритмов. Но видимо очень мало кому охото с этим париться, поэтому не прижилось…


    1. abbaboka
      06.11.2018 16:23

      думаю: почему не сделают алгоритм, обеспечивающий детерминированную генерацию квадративков с сохранением большей части информации?


      www.computerra.ru/180360/pixelize-it

      Продавать японцам лишённый пиксельной цензуры контент (такой есть, потому что его отправляют на экспорт) — самое прямое и, можно сказать, банальное решение задачи. Но признаюсь, лично я был поражён, когда узнал, что только этим дело не ограничивается. Вместе с партиями компактов у тех же торговцев часто изымают оригинального вида электронные устройства, предназначенные для… ну, вы догадались, для снятия пикселизации с картинки на экране ТВ.

      Заголовок спойлера
      image


  1. Tertium
    06.11.2018 13:57

    Вот видите, а тут у наших чиновников обнаружилась прозорливость — они запрещают аниме и хентай целиком. Попробуйте восстановить картинку из полностью зеленого квадрата!


    1. domix32
      06.11.2018 18:18
      +1

      «Возьми ещё этих манящих чёрных квадратов, да залей зелёным»


    1. Sklott
      07.11.2018 09:07

      .


    1. masv
      07.11.2018 16:55

      раржпег


  1. dext63r
    06.11.2018 14:05

    Как пример борьбы с этим законом внутри страны, можно рассматривать всякие пиксельные хентайные игры, которые всё набирают и набирают популярность.
    Так как цензурить там нечего.
    Даже на ютубе прохождение этих игр не всегда цензурят.
    Tobihime (или Flying Princess другое название) например.
    Этакий Angry Birds 18+


  1. Konachan700
    06.11.2018 14:16
    +1

    Я до сих пор не сильно понимаю, зачем цензурить порно. Я еще понимаю, когда в обычном кино или мультике цензурят всякое, ну мало ли кто будет смотреть… Но цензурить порно… Зачем, какой смысл? После наложения квадратиков сразу становится непонятно, что происходит?


    1. dext63r
      06.11.2018 14:32

      Я бы поискал ответы, но не на рабочем же компьютере?
      Возможно этому закону предшествовали какие-нибудь исследования, а возможно это просто ещё один выверт японского менталитета.
      Помню читал одну статью в одном журнале околокомпьютерной тематики.
      Хм… журнал точно сохранился, но с моим запасом макулатуры — это всё равно, что искать иголку в стоге сена.


    1. vassabi
      06.11.2018 14:44

      вообще-то, 90% того, что в интернете по данной теме скачивают — это сканы с печатной продукции, а вот уже её — проверяют на предмет наличия черных плашек на типографиях (по крайней мере те типографии, которые не хотят себе иметь потом проблем).


    1. Yaong
      06.11.2018 15:38

      Цензура это конечно плохо. Но с другой стороны — может именно цензура виновата в том, что японское порно стало таким, каким оно сейчас является. Табу не на все эротические работы в целом, а только на изображение половых органов могло привести к тому, что стали к этому подходить максимально творчески. И мы имеем и глубокие сюжеты, и шикарные визуалы и невероятный набор всевозможных фетишей и так далее, что не особо то наблюдалось за пределами зацензуренного архипелага островов. И ведь именно особый интерес к расцензуриванию именно японского эро контента, а не какого-либо другого.


      1. dext63r
        06.11.2018 15:58

        именно цензура виновата в том, что японское порно стало таким, каким оно сейчас является.

        Я статью читал на эту тему.
        Вы правы. )


    1. abbaboka
      06.11.2018 15:45

      Но цензурить порно… Зачем, какой смысл? После наложения квадратиков сразу становится непонятно, что происходит?

      Если вам действительно все понятно — то какая вам разница цензурят или нет.
      Мне вот порно с квадратиками не интересно.


    1. mkshma
      06.11.2018 15:46

      Не знаю как в других странах, а у японцев благодаря этому можно торговать данной продукцией хоть в ближайшем хоз. маге.


    1. navion
      06.11.2018 16:11

      Часть порно снимают понарошку и цензура даёт это скрыть, а статья в УК появилось под влиянием Запада (ханжей-пуритан) во время Реставрации Мэйдзи.


    1. adictive_max
      07.11.2018 04:55

      Это просто абуз кривых формулировок в законах. То есть с квадратиками — это как бы уже не совсем порно, а всего лишь эротика, которую можно свободно продавать, если прилепить наклеечку «18+».
      Законы эти изначально были Японии навязаны, поэтому они и прописаны «на отвали» и править их никто особо не спешит, т.к. по большей части всем пофиг.


    1. motomac
      07.11.2018 09:05

      Особенно удивляет «усердие» по наложению этих квадратиков. Зачастую они вообще ничего не закрывают. Чисто для галочки квадратика.


  1. OnelaW
    06.11.2018 14:45

    Скажем идея хорошая.Те же гейм-погромисты из Ниппон обожают производить порно-новелы для пк. Почему собственно не подключить подобный сервис, поиграл, вытер руки от белка и дальше заниматься делами.


  1. Zmiy666
    06.11.2018 15:10
    +3

    на самом деле гениально… сделать сайт с порно, но нейросеть будет квадратить все «нецензурные» места. Можно спокойно пройти любую проверку любого законодательства — сайт не содержит материалов с нецензурными изображениями. А пользователям продавать или распространять приложение/плагин с отдельной фирмы «восстановления поврежденных фото и видео материалов» который будет обратным алгоритмом восстанавливать на лету все фото и видео участки, измененные нейросетью. И предъявить тут некому и нечего. Сайт не распространяет порнографию — пользователь сам «крутой хакер» и взламывает картинки (к нему они приходят зацензуренными) — все вопросы к нему, но обычно частный просмотр не запрещен, только распространение запрещено)


    1. GokenTanmay
      06.11.2018 15:38
      +1

      Что мешает просто «перемешать» пикселы в однозначно определенном порядке, а пользователю поставить плагин, «перемешивающий» их обратно? Что-то в Вашей идее не вяжется — думаю не все так просто. Тот же JPG файл при просмотре через notepad не несет какой либо информации — но это не значит, что его можно распространять…


      1. ICELedyanoj
        06.11.2018 15:47

        Можно сохранять оригинальные куски и (или) алгоритмы по их восстановлению прямо в EXIF зацензуренных картинок.


        1. Tertium
          06.11.2018 15:55

          Или просто включить фантазию!


          1. GokenTanmay
            07.11.2018 09:58

            Как это ни странно, но да. Беглый взгляд на репу показал, что NN не делает различия в контексте изображения. т.е. не учитывается, что и как изображено. Возможно автор имел ввиду совершенно другое, а сетка дорисует только то, чему обучена, а ведь могла бы дать оценочное суждение правдоподобия восстановленного изображения.


        1. barbanel
          06.11.2018 16:06

          А потом кто-то прежмет/перепостит чем-то, что в EXIF не умеет, и фсьо, прощай удовольствие)
          В таком случае имхо нужно делать специальную разметку на зацензуреной области, уточняющей как это декодировать. Что-то типа цензурирующего QR.


          1. iig
            06.11.2018 18:54

            нужно делать специальную разметку на зацензуреной области, уточняющей как это декодировать.


            В это место просятся DRM-решения на базе блокчейна в форм-факторе «умных очков». Необходима четкая дифференциация, кому доступно расцензурить зацензуренное, а кому нет. Кому видеть мир без рекламы, а кому с ней…


            1. barbanel
              06.11.2018 19:09

              Вот не надо тут!


  1. SmartyTimmi
    06.11.2018 16:25

    Ну наконец-то


  1. Tarson
    06.11.2018 16:49

    Надо на черный квадрат Малевича нейронную сеть натравить.
    Воссоздаст ли она битву негров ночью в пещере?


    1. jehy Автор
      06.11.2018 17:07

      Если её тренировали на указанной в посте выборке — скорее всего, она воссоздаст что-то совсем другое.


      1. dimm_ddr
        07.11.2018 16:47

        Так как сеть скорее всего берет данные из картинки, то там с высокой вероятностью будут негры. Ну и слово «битва» можно интерпретировать достаточно широко, была бы фантазия. Так что вполне возможно что именно «битву негров» нейросеть и выдаст…


  1. DSLow
    06.11.2018 18:36

    Она пока что не работает на видео, сосках и анусах.

    Насколько я знаю, анусы никто не цензурирует в японских артах.
    Да и соски, я видел, не особо тоже.


    1. jehy Автор
      06.11.2018 18:40
      +1

      Из официальной документации — «censorship of anus» — так что вряд ли я ошибся. Ну разве что там было что-то про РКН. Возможно, вы смотрите слишком мало хентая.


      1. DSLow
        06.11.2018 18:41

        В твиттере постоянно есть изображения с открытыми сосками и сфинктерами, но перечеркнутыми гениталиями. Примеры кидать не буду smh.

        А если говорить про хентай, то там конкретно запикселенная(размытая) цензура. В переводе выше вроде говорится про рецензуру полосок EDIT: Окей, про пиксели тоже. Но пиксельную цензуру я вижу гораздо реже, чем полоски. А полоски используются в артах, додзинси и т.п.; здесь мы возвращаемся к предыдущему сообщению.


    1. pnetmon
      07.11.2018 11:45

      Она пока что не работает на видео, сосках и анусах.

      Да сосков полно даже не в хентае, а в обычном аниме, и часто в эфире на больше части каналов их нету, а на некоторых есть. Не говоря про дисковые версии… Может им просто долго ждать выхода на дисках, а хочется прям сейчас увидеть женскую грудь без цензуры?


      А так да, и анусов полно когда они не используются.


  1. Stealch
    06.11.2018 18:39

    Идея хороша. Если продолжить развитие — то данная программа сможет убирать любую цензуру, не только из мультфильмов, но и параноидальное закрашивание сигарет в России и подобный бред, существующий по всему миру. Когда проект достаточно разовьётся и сможет убирать цензуру в реальном времени — предсказываю данному проекту большое будущее и кучу запретов.


  1. DSLow
    06.11.2018 18:49
    +1

    Про статью вообще:
    Там ссылка на тренды кидает в тренды. ИМО, лучше этот факт заменить скриншотом, а ссылку дать на саму репу. Потому что через год-два по ссылке уже может и не быть этой программы в топе.
    Я думаю каждый в интернете натыкался на пятилетней давности посты с хабра, верно.


    1. jehy Автор
      06.11.2018 18:57

      Да, лучше сделать и то и другое — скрин в качестве пруфа, и ссылку для тех, кто не знает про эту фичу. Спасибо.


  1. nidalee
    06.11.2018 19:24
    +1

    It does NOT work with:
    Black and white/Monochrome image
    Большая часть зацензуренного контента в B&W, зачем они начали с цветных изображений, они разве не заведомо сложнее?


  1. Kroid
    06.11.2018 20:44

    Согласен с одним комментатором с реддита:

    WHY DID WE NOT NAME THIS «OppAI»!?!?!
    Come on man we missed a golden opportunity for this one.


    1. RinonNinqueon
      07.11.2018 08:12

      Плюсую!
      (Не могу голосовать)


    1. Deosis
      07.11.2018 08:22

      Судя по статье, до туда алгоритм ещё не дотягивается.


      Она пока что не работает на видео, сосках и анусах.


  1. serg_deep
    06.11.2018 22:46

    Боже… Да его канонизировать нужно.


  1. Psionic
    07.11.2018 13:21

    Эхх, когда хочешь заняться нейросетями, но не переносишь питон, может хоть на этот раз?


  1. Kwisatz
    07.11.2018 14:10

    Это была одна из самых величайших потерь, которые понесло искусство Возрождения. В 1857 году папа Пий X решил, что чрезмерно точное воспроизведение мужского тела может пробудить похоть у обитателей Ватикана. Поэтому, вооружившись резцом и киянкой, он собственноручно срубил гениталии у всех мужских скульптур. Папа изувечил шедевры Микеланджело и Бернини. Нанесенные скульптурам повреждения были стыдливо прикрыты алебастровыми фиговыми листками.


    Столько возни изза ханжей, такая прелесть а. Хотя при всем при этом у японцев есть множество вещей которых бы ввели наших и даже европейский ханжей в такой ужас…


  1. aleksandros
    08.11.2018 09:29

    Хоть одна хорошая новость