
За пару минут GenAI может сгенерировать целую симфонию. Означает ли это что музыканты останутся не у дел и скрипач уже действительно не нужен? Разбираемся в вопросе.
Пока, Морриконе
Музыканты эмоционально пострадали не меньше, чем все остальные творцы, когда на горизонте замаячил GenAI. Писать музыку — труд тяжелый, порой каторжный и к тому же часто плохо вознаграждаемый. Весть о том, что какие-то там умные алгоритмы справляются с этим за минуту и вот-вот отберут хлеб, не могла не перекроить музыкальный рынок.
Но все ли действительно так безнадежно? Как и с другими сферами, где обитают музы (программирование сюда тоже относится), ситуация возникла двоякая.
Где музыкальный ИИ победил
Почти сразу безоговорочную победу GenAI одерживает в сфере “производственной музыки”. Иными словами джинглы, какие-то блеклые саундтреки для Ютуба, звуковые ассеты и прочие музыкальные обои он уже подмял под себя, при чем основательно.
Если верить прессе, то меньше десяти лет назад музыканты в онлайне зарабатывали сравнительно неплохие деньги. Например один манчестерский композитор, работая с Shutterstock, получал до 30к фунтов роялти в год, поставляя незамысловатые мелодии для промышленных нужд. И это только с одного стока!
Перемотать время на 2024 и тут уже совсем другая история: пришла Suno, доход муз. индустрийщиков начал заметно проседать, похудев на 1/4. И, вероятно, такая грустная динамика продолжится в обозримом будущем.
Иоган Брамс писал свою симфонию № 1 до минор больше 20 лет. Каждая нота в брамсовском magnum opus была буквально выстрадана. За период написания композитор успел потерять своего лучшего друга Роберта Шумана, сошедшего с ума, затем влюбиться в жену лучшего друга и лишится матери — эти события отразились на психологической игре “мрака и света” в финальной редакции симфонии. Токенизация так сможет?

Причина здесь одна. Это максимально однотипная музыка — будь то эмбиент со звуками цейлонского дождя или очередной гимн корпоративной безвкусице под бренчащее укулеле.
Она построена на рекуррентных паттернах, которые заметит даже далекий от музицирования человек, не то что умная модель: предсказуемые гармонические переходы, уныло плетущаяся за ними мелодия, однотипные ритмы и все такое прочее. Музыкальный слоп существовал еще до нейронок. (“Ласковый Май” не даст соврать).
Также ИИ неплохо справляется и с другими типовыми задачами. Например, может набросать “страшный” саундтрек для игровой демки или слепить эффект взлетающего НЛО. А то и выдать несколько вариантов сразу, благодаря силе не детерминированной генерации.
Да, это будет звучать и даже неплохо, за исключением артефактов. Да, это можно использовать для прототипирования, а то и финализации проекта для релиза. Да, это стоит копейки или обходится вовсе бесплатно.
Штат Теннесси первым ввел законодательное уложение — “Акт ЭЛВИС” — защищающий оригинальную музыку от несанкционированного копирования ИИ. ELVIS в данном случае означает Ensuring Likeness Voice and Image Security — Обеспечение защищенности голоса и изображения от копирования.

Но проблема в том, что штамповка работает только до определенного, рокового момента. Если проект — будь то игра, фильм, какой-то интерактивный опыт — потребует дальнейшего развития, то и подход к продакшену понадобится посерьезней. Это как если бы огромная компания со штаб-квартирой на каждом континенте продолжала использовать Ucoz для своего сайта по сей день.
Эдвин Вотей изобрел механическое пианино или пианолу в 1895, которая играла роль магнитофона на Диком Западе (и не только). Пианола умела играть популярные регтаймовские пьески, записанные на съемные перфорированные валики. Однако ее появление не лишило работы пианистов — пианола не умела ни импровизировать, ни цеплять эмоциями. В итоге, люди шли на концерты Скотта Джоплина с еще большим удовольствием.

Где ИИ проигрывает на музыкальном ринге
В последнее время прослеживается один интересный тренд находить совершенство в недостатках. Эта идея не нова и, например, адепты дзэн-буддизма знакомы с японской философией wabi-sabi, которая учит наслаждаться трещинками в фарфоре или выцветшей краской на стене чайного домика.
ИИ, который постепенно водружает свое медиа-иго на каждом шагу, чересчур прилизан и стерилен. А стерильности место в хирургическом кабинете, но никак не в человеческой душе.

И мысль о том, что ugly is the new beauty — “уродство новая красота” — озвучивается все чаще, например в рекламе и вебдизайне. К жизни даже возвращается эстетика anarchist advertising с ядовитой палитрой цветов и вырвиглазными панк-коллажами.

Музыка не исключение. Если математическая модель может собрать какое угодно созвучие в любом стиле и сделает это безупречно, значит нужно привнести толику несовершенства в свое творчество, которая будет сигнализировать слушателю “Я живой. Я непостоянный. Прямо как и вы.”
Мат-рок дуэт Angine de Poitrine как раз доказывает, что непредсказуемость как в подаче, так и самой музыке прерогатива сугубо человеческая. Неординарность звука и образа, помноженная на энергичные 20-минутные сеты — это не по силам всем музыкальным генераторам вместе взятым.

Нейронка не сможет накопать личный смысл из террикона душевных терзаний для депрессивной баллады и перевести его в нервозный вокал Paranoid Android. Она не способна передать интимную атмосферу лесной хижины, где в десяти маленьких актах разворачивается драмы борьбы с соственным душевным мраком, как в Bon Iver.
И даже разухабистость шнуровкой “В Питере пить” в балканских тонах она воссоздать не сумеет — ну нет у нее чувств, нет уникальной эмпирики скитания от одной рюмочной к другой.
Стартап HarmonyCloak придумал как защитить живую музыку от копирования ИИ. Он добавляет в музыку не слышимый шум, который маскируется психоакустическими эффектами (частотное и временное маскирование), незаметными для человеческого уха, однако это делает трек непригодным для обучения ИИ. Его алгоритм:

Система разбивает один такт музыки на окна, определяет доминирующую частоту νm,tνm,t для трека m и окна t по скорости нот. Шум δm,tδm,t оптимизируется по bi-level задаче. Добавляется ограничением H(TH(ν))≤δm≤xmH(TH(ν))≤δm≤xm, где TH — порог слуха, H — преобразование в динамику.
То, что доступно нам — для ИИ терра инкогнита, куда он вряд ли причалит по причине эмоциональной слепоты.
Так что музыканты, делающие ставку на непредсказуемость, психологичность, личный опыт и “живизну” записи с необычной подачей как раз-таки способны оказаться в ощутимом плюсе. А все потому что настоящее и хаотичное станет глотком свежего воздуха на фоне ИИшной пластмассовой серости.
Выходит, скрипач нужен. Самое время склеить скрипку.
Комментарии (27)

Rive
08.05.2026 04:38HarmonyCloak
В обучении диффузных сетей для генерации изображений такой подход через зашумление парировался фильтрами очистки типа алгоритма сглаживания, так что инструменты вроде Glaze или Nightshade менее эффективны, чем их пользователи хотели бы.

GeorgSokolov96
08.05.2026 04:38Это уже какое-то ML-пиратство. Все равно что ходить по улице и разворачивать слои одежды на красивых девушках, которые этого явно бы не хотели. Ну не этично это, в конце-то концов

tgenn
08.05.2026 04:38С одной стороны ЫЫ-музыканты дают возможность прикоснуться к сознанию музыки и песен тем, у кого идеи горят, а руки крюки. Про слух вообще молчу. Наверное это даже не плохо. Ну точно не хуже 100500 котят в телефоне "профессионального" фотографа.
С другой стороны, если разговаривать за деньги, то для людей творческих все будет хуже со временем. ЫЫ будет методично отбирать контракты и бюджеты.
Вот если это хобби, с деньгами от других активностей, то да, можно упарываться в уникальность и находить своего слушателя.

babvrby
08.05.2026 04:38В рассуждениях об ИИ, я бы все время использовал слово "пока", в смысле пока ИИ такой-то. Например, когда-то он не проходил тест Тьюринга, теперь проходит запросто. Кто написал текст, человек или ИИ, уже не определяется, а угадывается с вероятностью 50 на 50. Вспомните первые машинные переводы, и какие они сейчас. В музыке он пока вот такой, как Вы описали. А теперь представьте, наконец-то запускают ИИ с искусственным сознанием, и появляются настоящие композиторы-машины и исполнители-машины с сознанием, а значит, у них будет субъективный опыт со всеми причиндалами, в том числе и с эмоциями. Я в этом беды не вижу, потому что на многое мы взглянем тогда намного шире и мир наш станет богаче. Пока не вижу.

zarfaz
08.05.2026 04:38По моему скромному мнению, ИИ может выступать исполнителем, а не композитором. Например человек, обладающий хорошими слухом и чувством прекрасного в музыке может выступать в роли контролёра, композитора и корректировать то что выдает ИИ. По схожести с тем как архитектор проверяет программное обеспечение по структуре, а дизайнер запрашивает детальную композицию на изображении у ИИ

DimaIam Автор
08.05.2026 04:38В качестве инструмента — почему бы нет. Если ИИ остается очередной кисточкой в тулките, а не автором, инициатором и исполнителем в одном флаконе, то он не вызывает вопросов.

GeorgSokolov96
08.05.2026 04:38Дело уже давно не только в музыке, но еще и в личности ее издавателя-игрателя-сочинятеля. Я вот не думаю, что ИИшка сможет сделать что-то на подобие кухонных альбомов Летова, которые звучат максимально всрато, но что-то в них тем не менее есть. (За Bon Iver спасибо).

savostin
08.05.2026 04:38Я лично не понимаю почему улучшение качества ИИ воспринимается как негатив. Это означает, что будет больше (возможно лучших) продуктов, программ, картин, музыки, текстов, лекарств, идей (и даже открытий) и прочее, и прочее. Это означает, что цивилизация будет развиваться быстрее. ИИ лишь инструмент. Он увеличивает производительность труда.

GeorgSokolov96
08.05.2026 04:38Может потому что ИИ пытаются везде сейчас всунуть вместо живого человека? Пусть ИИ занимается той работой, которую реально может делать – перелопачивать большие массивы данных, снижая рутинную нагрузку, не пытаясь подмять под себя все остальное. "Суббота для человека, а не человек для субботы".

savostin
08.05.2026 04:38Неужели вы не подставите молоток под закрывающуюся дверь, если нет под рукой подходящего спец оборудования?
А Ии суют везде потому, что почти в любом деле нужно перелопачивать информацию чтобы произвести что-то новое. И часто человек справляется с этим хуже.

eeglab
08.05.2026 04:38Люди разных профессий думают, что уникальны. Программисты, переводчики, юристы, врачи (терапевты в основном), художники, дизайнеры, композиторы - все ПОКА незаменимые. Сколько тут было два года назад баталий от IT, что никогда не заменит, год назад - уже не так уверенно, сейчас я на 100% уверен, что ручками код уже никто не пишет, и платят Anthropic, несмотря на все блокировки как за ЖКХ. Вопрос времени

sbr2
08.05.2026 04:38Я пишу. Если ведешь большой проект, у тебя токинов не хватит пояснить, что нужно сделать )))). Какие то мелкие вещи можно и нейронку попросить в конечном счете это быстрее чем гуглить.

sbr2
08.05.2026 04:38Нейронкам трудно ходить по барам и называться при этом "живая музыка". Легко понять, что это нейронка по оборотам речи. И это сразу вызывает отторжение. Про ролики, которые начинаются с фразы "этот парень...". Книги от нейронки полная чушь, 99% песен так же. Кто то конечно бросит творчество, зато те кто останется снимут сливки в будущем.

ru4pae
08.05.2026 04:38Всё просто. 50 и более процентов людей создающих проходную музыку перейдут на работу с ИИ. Будут как и раньше делать штамповку.
10 процентов всех музыкантов как и раньше будут создавать композиции достойные прожить больше чем пару месяцев.
Через дцать лет, написание музыки вручную останется уделом одиночек. Или дико успешных или маргинальных.

YMA
08.05.2026 04:38Сгенерированную музыку уже очень сложно отличить от человеческой. :(
Если еще полгода назад можно было заметить "шершавость" голоса и сумбурность аранжировки...
для сгенерированных изображений это примерно как тут...

На этом фрагменте видно, что структура, которая на общем плане воспринимается естественно, на самом деле - случайное переплетение линий и образов, человек бы так не сделал. полное изображение
...то сейчас уровень вырос очень сильно, я лично уже иногда сомневаюсь, и приходится искать "исполнителя", если описания коллектива в сети не нашлось - значит, нейромузыка.

Assador
08.05.2026 04:38Я думаю, дело в том, что простая, примитивная музыка играет на таких же простых и примитивных чувствах слушателя, и с этим ИИ сейчас легко справляется. Какие-то действительно цепляющие произведения апеллируют уже к большому эмоциональному опыту человека, опыту в масштабах жизни. А этого у ИИ сейчас просто нет.

YMA
08.05.2026 04:38Движется к этому весьма быстрыми темпами, зацените (это достаточно старый трек, но уже...):
YOZIL - Ballad of Sirin https://music.yandex.ru/track/140097833

GeorgSokolov96
08.05.2026 04:38Чушь это все. Он просто собезьянничал чужое, скорее всего.

YMA
08.05.2026 04:38Так найдите оригинал и натыкайте ИИ носом ;)
И это "она", тогда уж https://m.vk.com/yozilmusic

domix32
08.05.2026 04:38<..> незаметными для человеческого уха, однако это делает трек непригодным для обучения ИИ. Его алгоритм:
напомнило историю с реддита, как некий артист попытался отравить тренировочные данные добавив хитрый шум в картинки, ради защиты от плагиата собственных работ, естественно. Разрабы нейронок посравнивали картинки и пришли к выводу, что шум наоборот улучшал качество генерации и начали благодарить артиста за лайфхак. Так что есть подозрение, что и этот фильтр может оказаться полезным для тренировки.

Fedorkov
Имхо, не упомянут главный аргумент. В конечном счёте музыка пишется для людей, поэтому пока искусственные нейронки не эмулируют естественные достаточно детально, они не смогут оценить какие-то принципиально новые художественные приёмы, и им остаётся только имитировать чужое творчество.
Faxfox
Все циклично, помню было время для домохозяек продвигали кухонные комбайны, где один агрегат может делать все, а сейчас в тренде опять ножи.
ssj100
Ножи были всегда просто комбайны немного внедрив часть хоязяек поигрались и хватит.