Эротическая литература шаблонна: одни и те же возбуждающие слова, эпитеты и, разумеется, одни и те же действия. Это же идеальные условия творчества для бота!

Журналистка Даниэла Эрнандес (Daniela Hernandez, на фото) решила проверить эту теорию.

Знакомый программист сказал ей, что для обучения нейросети нужно хотя бы 750 000 слов, так что поиск текстов занял некоторое время. Она скачала произведения из нескольких специализированных электронных библиотек, где эротика публикуется под лицензией Creative Commons, а также обратилась к авторам с просьбой поделиться своими романами для эксперимента.

Для обучения «эротического бота» взяли свободную программу char-rnn — многоуровневую рекуррентную нейросеть, которая учится предсказывать следующие буквы в последовательности. На образцах эротики вроде «Бессмертных Симспонов» из библиотеки Даниэлы нейросеть должна была научиться составлять соответствующие слова и предложения.

У девушки не было опыта программирования, но он не понадобился. В интернете можно найти понятные инструкции, как обучать char-rnn. Кстати, немецкий разработчик Самим Винигер (Samim Winiger) читал лекцию на TED по этой теме. Он же ранее создал нейросеть, которая умеет распознавать порно на видео. То есть Винигер — опытный специалист в сфере, скажем, нейросетей.

Затем Даниэла зарегистрировалась в облачном сервисе Terminal, загрузила туда собранные тексты и запустила процесс char-rnn в виртуальной машине.



Виртуальная машина обошлась не слишком дорого: $0,006 в час. После нескольких дней обучения Erotibot был готов к сочинению собственных произведений.

Для работы боту нужно ввести первые фразы, а дальше он уже сам. Например, вот некоторые образцы, в тексте и аудиоварианте (синтезатор речи от Acapela Box).





Нужно признать, лексика у бота странноватая, иногда он даже использует несуществующие слова. Но ведь это просто любительская поделка на маленькой словарной базе. Другое дело, если созданием подобных программ займутся профессионалы…

Комментарии (20)


  1. rPman
    14.07.2015 14:52
    +1

    Замените 'тексты' на 'видеоклипы' и в принципе теория останется такой же верной, правда существующие алгоритмы генерации пока только для любителей психоделики подойдут, но лиха беда начало.


    1. maaGames
      14.07.2015 15:21
      +2

      Психоделическое порно, созданное нейросетью из белого шума? Я бы посмотрел.


      1. Riketta
        14.07.2015 17:16

        Вот, например. Ну не белый шум, конечно. Но и так сойдет.


        1. rPman
          14.07.2015 17:34
          +6

          Не, не, не… весь смак в обратном процессе, заставить нейросеть, обученную на распознавании порнороликов (а не животных как в этих примерах), рисовать картины… вместо глаз, ушей и других узнаваемых частей животных дорисовывать отдельные части тела высших приматов ;)


    1. DancingOnWater
      15.07.2015 09:20

      Генераторы персонажей уже много лет делают, анимационные движения ограничены. Игровые движки есть готовые. Голосвые движки тоже.

      Если будет генератор текстов, то построение видео и звукоряда вопрос уже решаемый.


  1. Flammar
    14.07.2015 16:10
    +1

    «Эрошизофазия»…


  1. lucius
    14.07.2015 18:47
    +18

    Надо обучить нейронную сеть генерировать книги по бизнес литературе.
    Примерный план:

    * От издателя о том, какими бешеными темпами продавалась книга и что была переведена на 100500 языков;
    * Благодарности всяческим случайным людям, которые вроде как помогали писать;
    * Вступление рассказывающее, что информация этой книги перевернет сознание и ваша жизнь будет сладка как мёд, коллеги и партнеры будут обожать вас, а деньги будут сами идти к вам в руки.
    * Несколько глав о том, что книга очень важна, нужно ее перечитывать, делать пометки на полях, и перечитывать до конца жизни как минимум раз в месяц;
    * Парочка унылых рассказов и несмешных анекдотов, какбэ подтверждающих написанное;
    * Какая-нить идея от Капитана Очевидность.
    * Заключение, в котором можно писать что угодно — его никто не помнит.


    1. AmberSP
      14.07.2015 18:50
      +4

      А как они сейчас пишутся? Разве не так же?


      1. lucius
        14.07.2015 18:54
        +7

        Сейчас же пока что их пишут люди… хотя постойте, OH SHI—


    1. Webnode
      14.07.2015 19:36
      +1

      В яблочко!
      Марио Пьюзо в «Fools die» так и расписал сценарий продвижения книги.
      Прямо на ней же.


  1. spc
    14.07.2015 20:44
    +7

    Если судить по абзацу, это откровенный бред. И даже «несуществующие» слова здесь совершенно ни при чем. Так что, парни, расходимся, мы наблюдаем очередной развод по принципу «все лучше с нейросетями».


    1. Raegdan
      14.07.2015 21:29

      Да, но наколенная прога, способная в промышленных масштабах срать неотличимым от написанного человеком текста на заданную тему, была бы на несколько порядков страшнее. Единственная профессия, для которой она могла бы иметь практическую пользу и приносить профит — сеошники. Они моментально засрут интернет текстами, которые не воспринимаются как бред, но несут адский винегрет из смысла оригинальных статей. Представьте, что человек ищет статьи по технике безопасности… Так что слава Ктулху, что получились очередные Яндекс-Рефераты, а не революция в машинной лингвистике.

      З.Ы. «Рефераты» сеошники тоже любят. Попробуйте прогуглить в кавычках какой-нибудь кусок настоящей фразы, из которых собирается реферат.


    1. AlexBaklanov
      15.07.2015 22:04
      +1

      У меня тоже ощущение, что из комментаторов только мы с Вами читали текст.
      Там человек и близко смысла не увидит, если его не предупредить, что это текст на тему эротики.


  1. SovGVD
    14.07.2015 22:51

    А что если подобную нейросеть обучать на произведениях классиков?


    1. barmaley_exe
      16.07.2015 20:22

      Шекспир сгодится? В оригинальной статье разработчика char-rnn есть такой. Ещё из интересного там есть (почти валидный) тех и код на Си.


  1. Impuls
    15.07.2015 08:21

    Так вот как пишет свои книги Дарья Донцова


  1. edwardspec
    15.07.2015 10:53
    +2

    У девушки не было опыта программирования, но он не понадобился.
    На собеседовании:
    — Здравствуйте, юная леди. С ходу вижу, что вы многим можете помочь порноиндустрии.
    — Да, могу бота настроить.
    — И вам нравится этим заниматься?
    — Да, безумно!
    — Ну садитесь и покажите, на что вы способны. Компьютер — там.


  1. dtestyk
    16.07.2015 14:32

    бота настроить
    звучит как минимум двусмысленно :)


  1. Apazhe
    17.07.2015 08:08

    В 2008 или 2009 году на одном закрытом и узкоспециализированном форуме некий гражданин, старательно хранивший анонимность, показывал результаты работы генератора текстовой порнухи. Он утверждал, что разработал программу, автоматически пишущую связные тексты этой тематики.

    Для проверки предлагал постить задания — тематику рассказа, имена персонажей и ключевые слова. В ответ через несколько минут постил готовый рассказ. Тексты получались вполне связные, с очень незначительными косяками. Гугль находить их в интернетах отказывался.

    Целью гражданина было найти партнёра для зарабатывания бабла в адалте. Продавать софт он не собирался.

    Подписчикам не удалось уличить гражданина в мошенничестве. А потом он внезапно перестал выходить на связь.


  1. aszhitarev
    22.07.2015 12:38

    Вот взяли и отняли у авторши «50 оттенков» безбедную старость!