Нужен или не нужен?
Нужен или не нужен?

За пару минут GenAI может сгенерировать целую симфонию. Означает ли это что музыканты останутся не у дел и скрипач уже действительно не нужен? Разбираемся в вопросе.

Пока, Морриконе

Музыканты эмоционально пострадали не меньше, чем все остальные творцы, когда на горизонте замаячил GenAI. Писать музыку — труд тяжелый, порой каторжный и к тому же часто плохо вознаграждаемый. Весть о том, что какие-то там умные алгоритмы справляются с этим за минуту и вот-вот отберут хлеб, не могла не перекроить музыкальный рынок.

Но все ли действительно так безнадежно? Как и с другими сферами, где обитают музы (программирование сюда тоже относится), ситуация возникла двоякая.

Где музыкальный ИИ победил

Почти сразу безоговорочную победу GenAI одерживает в сфере “производственной музыки”. Иными словами джинглы, какие-то блеклые саундтреки для Ютуба, звуковые ассеты и прочие музыкальные обои он уже подмял под себя, при чем основательно.

Если верить прессе, то меньше десяти лет назад музыканты в онлайне зарабатывали сравнительно неплохие деньги. Например один манчестерский композитор, работая с Shutterstock, получал до 30к фунтов роялти в год, поставляя незамысловатые мелодии для промышленных нужд. И это только с одного стока!

Перемотать время на 2024 и тут уже совсем другая история: пришла Suno, доход муз. индустрийщиков начал заметно проседать, похудев на 1/4. И, вероятно, такая грустная динамика продолжится в обозримом будущем.

Иоган Брамс писал свою симфонию № 1 до минор больше 20 лет. Каждая нота в брамсовском magnum opus была буквально выстрадана. За период написания композитор успел потерять своего лучшего друга Роберта Шумана, сошедшего с ума, затем влюбиться в жену лучшего друга и лишится матери — эти события отразились на психологической игре “мрака и света” в финальной редакции симфонии. Токенизация так сможет?

Причина здесь одна. Это максимально однотипная музыка — будь то эмбиент со звуками цейлонского дождя или очередной гимн корпоративной безвкусице под бренчащее укулеле. 

Она построена на рекуррентных паттернах, которые заметит даже далекий от музицирования человек, не то что умная модель: предсказуемые гармонические переходы, уныло плетущаяся за ними мелодия, однотипные ритмы и все такое прочее. Музыкальный слоп существовал еще до нейронок. (“Ласковый Май” не даст соврать).

Также ИИ неплохо справляется и с другими типовыми задачами. Например, может набросать “страшный” саундтрек для игровой демки или слепить эффект взлетающего НЛО. А то и выдать несколько вариантов сразу, благодаря силе не детерминированной генерации.

Да, это будет звучать и даже неплохо, за исключением артефактов. Да, это можно использовать для прототипирования, а то и финализации проекта для релиза. Да, это стоит копейки или обходится вовсе бесплатно.

Штат Теннесси первым ввел законодательное уложение — “Акт ЭЛВИС” — защищающий оригинальную музыку от несанкционированного копирования ИИ. ELVIS в данном случае означает Ensuring Likeness Voice and Image Security — Обеспечение защищенности голоса и изображения от копирования.

Но проблема в том, что штамповка работает только до определенного, рокового момента. Если проект — будь то игра, фильм, какой-то интерактивный опыт — потребует дальнейшего развития, то и подход к продакшену понадобится посерьезней. Это как если бы огромная компания со штаб-квартирой на каждом континенте продолжала использовать Ucoz для своего сайта по сей день.

Эдвин Вотей изобрел механическое пианино или пианолу в 1895, которая играла роль магнитофона на Диком Западе (и не только). Пианола умела играть популярные регтаймовские пьески, записанные на съемные перфорированные валики. Однако ее появление не лишило работы пианистов — пианола не умела ни импровизировать, ни цеплять эмоциями. В итоге, люди шли на концерты Скотта Джоплина с еще большим удовольствием.

Источник: izi.travel
Источник: izi.travel

Где ИИ проигрывает на музыкальном ринге

В последнее время прослеживается один интересный тренд находить совершенство в недостатках. Эта идея не нова и, например, адепты дзэн-буддизма знакомы с японской философией wabi-sabi, которая учит наслаждаться трещинками в фарфоре или выцветшей краской на стене чайного домика. 

ИИ, который постепенно водружает свое медиа-иго на каждом шагу, чересчур прилизан и стерилен. А стерильности место в хирургическом кабинете, но никак не в человеческой душе. 

Треснувшая чаша, эстетика ваби-саби. Иcточник: www.tofu.
Треснувшая чаша, эстетика ваби-саби. Иcточник: www.tofu.

И мысль о том, что ugly is the new beauty — “уродство новая красота” — озвучивается все чаще, например в рекламе и вебдизайне. К жизни даже возвращается эстетика anarchist advertising с ядовитой палитрой цветов и вырвиглазными панк-коллажами.

Пример anarchist advertising.
Пример anarchist advertising.

Музыка не исключение. Если математическая модель может собрать какое угодно созвучие в любом стиле и сделает это безупречно, значит нужно привнести толику несовершенства в свое творчество, которая будет сигнализировать слушателю “Я живой. Я непостоянный. Прямо как и вы.

Мат-рок дуэт Angine de Poitrine как раз доказывает, что непредсказуемость как в подаче, так и самой музыке прерогатива сугубо человеческая. Неординарность звука и образа, помноженная на энергичные 20-минутные сеты — это не по силам всем музыкальным генераторам вместе взятым.

Нейронка не сможет накопать личный смысл из террикона душевных терзаний для депрессивной баллады и перевести его в нервозный вокал Paranoid Android. Она не способна передать интимную атмосферу лесной хижины, где в десяти маленьких актах разворачивается драмы борьбы с соственным душевным мраком, как в Bon Iver

И даже разухабистость шнуровкой “В Питере пить” в балканских тонах она воссоздать не сумеет — ну нет у нее чувств, нет уникальной эмпирики скитания от одной рюмочной к другой.

Стартап HarmonyCloak придумал как защитить живую музыку от копирования ИИ. Он добавляет в музыку не слышимый шум, который маскируется психоакустическими эффектами (частотное и временное маскирование), незаметными для человеческого уха, однако это делает трек непригодным для обучения ИИ. Его алгоритм:

Система разбивает один такт музыки на окна, определяет доминирующую частоту νm,tνm,t​ для трека m и окна t по скорости нот. Шум δm,tδm,t​ оптимизируется по bi-level задаче. Добавляется ограничением H(TH(ν))≤δm≤xmH(TH(ν))≤δm​≤xm​, где TH — порог слуха, H — преобразование в динамику.  

То, что доступно нам — для ИИ терра инкогнита, куда он вряд ли причалит по причине эмоциональной слепоты. 

Так что музыканты, делающие ставку на непредсказуемость, психологичность, личный опыт и “живизну” записи с необычной подачей как раз-таки способны оказаться в ощутимом плюсе. А все потому что настоящее и хаотичное станет глотком свежего воздуха на фоне ИИшной пластмассовой серости. 

Выходит, скрипач нужен. Самое время склеить скрипку.

  

Комментарии (27)


  1. Fedorkov
    08.05.2026 04:38

    Имхо, не упомянут главный аргумент. В конечном счёте музыка пишется для людей, поэтому пока искусственные нейронки не эмулируют естественные достаточно детально, они не смогут оценить какие-то принципиально новые художественные приёмы, и им остаётся только имитировать чужое творчество.


    1. Faxfox
      08.05.2026 04:38

      Все циклично, помню было время для домохозяек продвигали кухонные комбайны, где один агрегат может делать все, а сейчас в тренде опять ножи.


      1. ssj100
        08.05.2026 04:38

        Ножи были всегда просто комбайны немного внедрив часть хоязяек поигрались и хватит.


  1. Rive
    08.05.2026 04:38

    HarmonyCloak 

    В обучении диффузных сетей для генерации изображений такой подход через зашумление парировался фильтрами очистки типа алгоритма сглаживания, так что инструменты вроде Glaze или Nightshade менее эффективны, чем их пользователи хотели бы.


    1. GeorgSokolov96
      08.05.2026 04:38

      Это уже какое-то ML-пиратство. Все равно что ходить по улице и разворачивать слои одежды на красивых девушках, которые этого явно бы не хотели. Ну не этично это, в конце-то концов


  1. tgenn
    08.05.2026 04:38

    С одной стороны ЫЫ-музыканты дают возможность прикоснуться к сознанию музыки и песен тем, у кого идеи горят, а руки крюки. Про слух вообще молчу. Наверное это даже не плохо. Ну точно не хуже 100500 котят в телефоне "профессионального" фотографа.

    С другой стороны, если разговаривать за деньги, то для людей творческих все будет хуже со временем. ЫЫ будет методично отбирать контракты и бюджеты.

    Вот если это хобби, с деньгами от других активностей, то да, можно упарываться в уникальность и находить своего слушателя.


  1. babvrby
    08.05.2026 04:38

    В рассуждениях об ИИ, я бы все время использовал слово "пока", в смысле пока ИИ такой-то. Например, когда-то он не проходил тест Тьюринга, теперь проходит запросто. Кто написал текст, человек или ИИ, уже не определяется, а угадывается с вероятностью 50 на 50. Вспомните первые машинные переводы, и какие они сейчас. В музыке он пока вот такой, как Вы описали. А теперь представьте, наконец-то запускают ИИ с искусственным сознанием, и появляются настоящие композиторы-машины и исполнители-машины с сознанием, а значит, у них будет субъективный опыт со всеми причиндалами, в том числе и с эмоциями. Я в этом беды не вижу, потому что на многое мы взглянем тогда намного шире и мир наш станет богаче. Пока не вижу.


    1. DimaIam Автор
      08.05.2026 04:38

      Лично мое мнение таково: человек всегда найдет способ выкрутиться :)


      1. Remigrant
        08.05.2026 04:38

        "ГОЛЕМА XIV" Станислава Лема прочитайте, и мнение ваше сильно поменяется, возможно - на противоположное.


  1. zarfaz
    08.05.2026 04:38

    По моему скромному мнению, ИИ может выступать исполнителем, а не композитором. Например человек, обладающий хорошими слухом и чувством прекрасного в музыке может выступать в роли контролёра, композитора и корректировать то что выдает ИИ. По схожести с тем как архитектор проверяет программное обеспечение по структуре, а дизайнер запрашивает детальную композицию на изображении у ИИ


    1. DimaIam Автор
      08.05.2026 04:38

      В качестве инструмента — почему бы нет. Если ИИ остается очередной кисточкой в тулките, а не автором, инициатором и исполнителем в одном флаконе, то он не вызывает вопросов.


  1. GeorgSokolov96
    08.05.2026 04:38

    Дело уже давно не только в музыке, но еще и в личности ее издавателя-игрателя-сочинятеля. Я вот не думаю, что ИИшка сможет сделать что-то на подобие кухонных альбомов Летова, которые звучат максимально всрато, но что-то в них тем не менее есть. (За Bon Iver спасибо).


  1. savostin
    08.05.2026 04:38

    Я лично не понимаю почему улучшение качества ИИ воспринимается как негатив. Это означает, что будет больше (возможно лучших) продуктов, программ, картин, музыки, текстов, лекарств, идей (и даже открытий) и прочее, и прочее. Это означает, что цивилизация будет развиваться быстрее. ИИ лишь инструмент. Он увеличивает производительность труда.


    1. GeorgSokolov96
      08.05.2026 04:38

      Может потому что ИИ пытаются везде сейчас всунуть вместо живого человека? Пусть ИИ занимается той работой, которую реально может делать – перелопачивать большие массивы данных, снижая рутинную нагрузку, не пытаясь подмять под себя все остальное. "Суббота для человека, а не человек для субботы".


      1. savostin
        08.05.2026 04:38

        Неужели вы не подставите молоток под закрывающуюся дверь, если нет под рукой подходящего спец оборудования?

        А Ии суют везде потому, что почти в любом деле нужно перелопачивать информацию чтобы произвести что-то новое. И часто человек справляется с этим хуже.


    1. babvrby
      08.05.2026 04:38

      когда-то и рабов считали просто инструментом, но "все течет и все меняеься"


  1. eeglab
    08.05.2026 04:38

    Люди разных профессий думают, что уникальны. Программисты, переводчики, юристы, врачи (терапевты в основном), художники, дизайнеры, композиторы - все ПОКА незаменимые. Сколько тут было два года назад баталий от IT, что никогда не заменит, год назад - уже не так уверенно, сейчас я на 100% уверен, что ручками код уже никто не пишет, и платят Anthropic, несмотря на все блокировки как за ЖКХ. Вопрос времени


    1. sbr2
      08.05.2026 04:38

      Я пишу. Если ведешь большой проект, у тебя токинов не хватит пояснить, что нужно сделать )))). Какие то мелкие вещи можно и нейронку попросить в конечном счете это быстрее чем гуглить.


  1. sbr2
    08.05.2026 04:38

    Нейронкам трудно ходить по барам и называться при этом "живая музыка". Легко понять, что это нейронка по оборотам речи. И это сразу вызывает отторжение. Про ролики, которые начинаются с фразы "этот парень...". Книги от нейронки полная чушь, 99% песен так же. Кто то конечно бросит творчество, зато те кто останется снимут сливки в будущем.


    1. DimaIam Автор
      08.05.2026 04:38

      Легко понять, что это нейронка по оборотам речи.

      Обижаете :)


  1. ru4pae
    08.05.2026 04:38

    Всё просто. 50 и более процентов людей создающих проходную музыку перейдут на работу с ИИ. Будут как и раньше делать штамповку.

    10 процентов всех музыкантов как и раньше будут создавать композиции достойные прожить больше чем пару месяцев.

    Через дцать лет, написание музыки вручную останется уделом одиночек. Или дико успешных или маргинальных.


  1. YMA
    08.05.2026 04:38

    Сгенерированную музыку уже очень сложно отличить от человеческой. :(

    Если еще полгода назад можно было заметить "шершавость" голоса и сумбурность аранжировки...

    для сгенерированных изображений это примерно как тут...
    На этом фрагменте видно, что структура, которая на общем плане воспринимается естественно, на самом деле - случайное переплетение линий и образов, человек бы так не сделал.
    На этом фрагменте видно, что структура, которая на общем плане воспринимается естественно, на самом деле - случайное переплетение линий и образов, человек бы так не сделал.
    полное изображение

    ...то сейчас уровень вырос очень сильно, я лично уже иногда сомневаюсь, и приходится искать "исполнителя", если описания коллектива в сети не нашлось - значит, нейромузыка.


  1. Assador
    08.05.2026 04:38

    Я думаю, дело в том, что простая, примитивная музыка играет на таких же простых и примитивных чувствах слушателя, и с этим ИИ сейчас легко справляется. Какие-то действительно цепляющие произведения апеллируют уже к большому эмоциональному опыту человека, опыту в масштабах жизни. А этого у ИИ сейчас просто нет.


    1. YMA
      08.05.2026 04:38

      Движется к этому весьма быстрыми темпами, зацените (это достаточно старый трек, но уже...):

      YOZIL - Ballad of Sirin https://music.yandex.ru/track/140097833


      1. GeorgSokolov96
        08.05.2026 04:38

        Чушь это все. Он просто собезьянничал чужое, скорее всего.


        1. YMA
          08.05.2026 04:38

          Так найдите оригинал и натыкайте ИИ носом ;)

          И это "она", тогда уж https://m.vk.com/yozilmusic


  1. domix32
    08.05.2026 04:38

    <..> незаметными для человеческого уха, однако это делает трек непригодным для обучения ИИ. Его алгоритм:

    напомнило историю с реддита, как некий артист попытался отравить тренировочные данные добавив хитрый шум в картинки, ради защиты от плагиата собственных работ, естественно. Разрабы нейронок посравнивали картинки и пришли к выводу, что шум наоборот улучшал качество генерации и начали благодарить артиста за лайфхак. Так что есть подозрение, что и этот фильтр может оказаться полезным для тренировки.