В 2016 году в России вышел первый музыкальный альбом в стиле Егора Летова, автором текста песен которого выступила нейросеть, созданная силами сотрудников Яндекса Алексея Тихонова и Ивана Ямщикова. 

Нейросети, или искусственные нейронные сети (ANN) – подмножество алгоритмов машинного обучения (ML). Понятие возникло вследствие проведения аналогии между процессами в человеческом мозге при передаче сигналов нейронами. Структура искусственных нейросетей состоит из узлов, которые в свою очередь образуют слои. У каждого узла есть вес и пороговое значение. Данные с узла не передаются на следующий уровень нейросети только если выходные данные одного из узлов превышает пороговое значение. Обучение реализуется путем использования алгоритмов обучения. От их точности зависит скорость и качество вычислений. 

Вопрос технической реализации работы нейросети представители Яндекса оставили без особых подробностей, однако сведения о технологиях и предыдущем подобном опыте и исследованиях о генерации поэтических текстов нейросетями позволяют предположить несколько интересных решений. 

В основе проекта «Нейронная оборона» лежит language model – когда нейросеть предсказывает следующее слово, которое применил бы тот или иной автор текста. Language model – это статистическая модель, которая назначает вес словам, словосочетаниям и предложениям. В целом, при работе с языковыми моделями, интересно назначение вероятности словосочетаниям и предложениям. Однако, при работе с поэтическими текстами, интерес больше представляет вероятность слов и словосочетаний. 

Языковая модель предполагает предсказание следующего слова на основе контекста, часто называемом «историей». Появившаяся в результате работы над проектом нейросеть получилась достаточно многофункциональной, она пригодилась при подобной работе и с другими музыкантами и поэтами.

Скачок развития языковых моделей связывают с появлением GPT от OpenAI. В настоящее время, модель имеет 170 млрд. параметров. Она активно применяется в бизнесе, в частности, в SEO. 

Важную роль при реализации проекта играл простой подсчет ключевых слов. Если сравнивать «Нейронную оборону» с другими подобными проектами, то в случае с ней есть очень интересная особенность. Дело в том, что если смотреть на количество уникальных слов, то жанр панк-рока занимает предпоследнее место. На первом месте по уникальной лексике выступает рэп. Разница между роком и рэпом составляет в среднем 2 тысячи слов. Таким образом, при 100-200 уникальных словах в тексте рэп-композиции, в рок-тексте их будет 60-120. 

Когда нейросеть генерирует текст, она, обучаясь на текстах, пытается выявить закономерности на самом низком уровне: почему одна буква следует за другой, какова вероятность совпадения окружения одного и того же символа. Такая особенность хорошо сработала при создании текстов «Нейронной Обороны» - благодаря ней, к уникальным словам текстов можно отнести и междометия, и лексемы, не имеющиеся в словарях, но соответствующие общему духу и настрою текстов Летова. 

Строки, написанные нейросетью, стиль "машины" действительно напоминает стиль известного сибирского музыканта и поэта
Строки, написанные нейросетью, стиль "машины" действительно напоминает стиль известного сибирского музыканта и поэта

Годом позже, Яндекс реализовал еще один музыкальный проект, связанный с нейросетью – создание музыкальных произведений в стиле известного русского композитора Александра Скрябина. В этом проекте были использованы многие наработки «Нейронной обороны», да и участвовали в нем те же сотрудники Яндекса. В ближайшем будущем мы можем ожидать развитие музыкальных проектов, связанных с применением нейросетей. И более того, влияние на музыкальную индустрию таких проектов будет весьма заметным: применение нейросетей для создания текстов и музыки позволить реализовать самые неординарные и креативные идеи. 

Андрей Ветров

Копирайтер, переводчик компании Digex Co

Комментарии (12)


  1. balamutang
    01.02.2022 12:56
    +12

    Мало использовать вероятную последовательность слов как у копирумого автора, надо понимать иносказание, метасмысл, настроение передаваемое этими словами. А то получится как у Нейронной Обороны - шизофазия.

    Вроде слова и обороты теже, а смысла в их потоке нет.


    1. Exactoris
      01.02.2022 21:39
      +2

      Да тут поди научи нейронку метасмыслу) В данный момент то, что она выдаёт удобоваримый текст, это уже хорошо. Можно использовать в своих целях на изи


      1. copperfox777
        02.02.2022 18:30

        Скорее неудобоваримый. И бессмысленный. Пусть лучше учат водить авто.


      1. balamutang
        03.02.2022 13:38

        В каких-то целях да. Но не в искусстве.

        Искусство - это передача эмоций, а какие эмоции может передать робот, который их не испытывает? Эти вещи даже не каждый человек может делать т.к. не прошел какой-то путь для накопления эмоционального интеллекта (любовь, расставание, счастье, горе и тд), роботам тут в ближайшие 50-100 лет делать нечего.


    1. MaM
      02.02.2022 22:46
      +1

      Занового Мир, смысл точно есть, я вообще когда ее слушаю начинаю думаю как будто она о нас прогерах и писалась, что ещё придает легкую толику диссонанса, так то что автор нейросеть.

      А вообще, я когда пытался писать стихи, сразу после уровня:

      Научили машину писать симфонию,

      Что ни строка то шизофазия,

      Ритмы есть, но в целом какафония

      Пытался специально рушить привычные ритмы и ожидаемые рифмы. Иногда когда получалось совсем отвратительно, задумался как раз о смысле бредоискуства. Вообщем случае довольно сложно обьяснить, ценности как бы и нет, но она как бы и есть за счет именно аляповатости. Как картины Вангога, только хуже.


    1. Mishensk
      03.02.2022 13:25

      Кто видит смысл, тот сидит на небесах


    1. a_month
      03.02.2022 13:37
      +1

      Дополню. Слова, местами, возможно похожи. С оборотами и словосочетаниями - тут сильно хуже.

      Гениальность Летова в способности передать сильно больше информации слушателю, из рассчёта на физический бит. Следует, однако, заметить, что слушатель должен быть подготовлен, дабы корректно воспринять смыслы и отсылки. У автора на выходе, этакая "архивированная" квинтэссенция, посыл. А здесь, обратный эффект. Букв много, смысла 0. На этот результат " творчества" нейросети натыкался давно. После него был тест на опознание реальных текстов Летова и текстов, сгенерированных нейросетью. Не ошибся ниразу.


      1. balamutang
        03.02.2022 13:50

        Если развивать эту мысль то Летов это как архиватор, упаковывает настроение и эмоции в текст, используя словари жизненного опыта (опыта жизни в СССР 80х если точнее). И те у кого есть такие словари - могут распаковать его послания.

        Для тех у кого словари не те (или неполные) - послания будут выглядеть иначе, сжатые файлы текста будут битые. А у кого словарей вообще нет - те и не распакуют (и не запакуют - как эта нейросеть)

        По аналогии можно нейросеть учить на архивах текстов Льва Толстого (вырезав из них словари), а потом файлы сгенеренные по аналогии ей попробовать распаковать с этими отложенными словарями - тоже выйдет что угодно, кроме осмысленного текста.


    1. RRRomeo
      04.02.2022 00:58

      Если бы эти слова были в песне Летова - вы нашли бы там кучу метасиыслов.

      p.s. Я любитель и ценитель Егорки уже лет 30.


  1. wordwild
    01.02.2022 15:22

    Если стихи дурны, то это вина "богов", которые мне не дали большого дарования. (с)


  1. zzzzzzzzzzzz
    03.02.2022 21:42
    +1

    Арендованными граблями поскрести по сырой земле, наловить мелких букв, посадить их в консервную баночку, подсушить и хранить в холодильнике, до востребования.


  1. phanerozoi_evidence
    03.02.2022 23:48

    Во истину макет оказался сильнее..