Как я попал в кроличью нору AI музыки
Всем привет, я думаю некоторые из вас уже слышали про новый text-to-music
сервис от ElevenLabs. Буквально вчера вечером я увидел у себя на почте новости по AI и среди них, кроме выхода GPT-5, OSS, Opus 4.1 закралась эта text-to-music
моделька.
Я сразу же открыл стартовую страничку: https://elevenlabs.io/music и впал в легкий шок.
Я уже привык ловить кринж с видосов от Veo и Sora, от озвучки аватаров от HeyGen
(с которым кстати у меня есть небольшой проект) ну и прочих других сервисов обработки и генерации контента. Особенно ужасно это звучит на русском, но и на английском некоторые сервисы все еще проседают.

И вот открываю я страничку, слушаю музыку из тех что уже в заготовках и понимаю что это круто, я чувствовал шок, восторг, восхищение, которое в последний раз у меня смог вызвать разве что Claude Desktop с MCP, но музыка — это совсем другой уровень, это не просто сухой текст, или вызов очередной тулы а то что пытается закрасться тебе в душу и у него это неплохо получается (почти).
В этой статье я хотел бы сделать обзор слитых потраченных кредитов в генерацию, я покажу промпты, подход к тому как эти промпты составлялись генерились. Поговорим про прайсинг, стоит ли тратить свои кровные на ИИ музыку, ну и конечно же послушаем то, что получилось.
Перед началом, стоит сказать, что я не тестил аналоги, поэтому сравнивать мне особо не с чем, поэтому делюсь тем, что уже получилось.
Если вы захотите в будущем сравнение с аналогами, дайте знать.
Послушаешь демку? Сделал по цене булочки
Учитывая текущие реалии, скорее всего вам для тестирования придется брать хоть какой‑то план, но формально ElevenLabs дает 10ка кредитов для тестирования, чего хватит примерно на 4–5 треков по 2–3 минуты. Мне ElevenLabs их дал, но сказал что я подозрительный чел, поэтому без оплаты отказался работать.
Прайсинг вы можете увидеть ниже:

Грубая стоимость 1 трека в 3 минуты — 2000 местных кредитов.
Исходя из прайсинга для моего плана за 5$ на месяц я получил 30ка кредитов, которые слил за один день.
Суммарно у меня получилось 13 треков, длительностью от 0:30 до 4:20 минут.
То есть один трек стоит ~0.4 $, что эквивалентно 32 рублям (по курсу 80 рублей за 1$).
По моему это вполне себе того стоит, особенно если вы создатель контента, которому нужно сделать музыкальную вставку и у вас есть для неё идея, которую существующая музыка не покрывает.
Да и кстати булочка в пекарне или магазине у дома стоит дороже чем 30 рублей сегодня.
Ну и я предвещаю, что скоро появится очередной набор сервисов аггрегаторов, интеграторов и прочих, которые позволят русской аудитории познакомится с сервисом в более массовом плане, но с опредленной доплатой в виде комисии/подписки или другого формата биллинга, но зато через рубли.
Как писать промпты и получать тот самый трек у себя в голове
Сначала я открыл Best Practices : Prompting Eleven Music там можно найти несколько фишек из серии :
Use the word “solo” before instruments (e.g., “solo electric guitar,” “solo piano in C minor”)
или
For vocals, use “a cappella” before the vocal description (e.g., “a cappella female vocals,” “a cappella male chorus”).
Из музыкальных инструментов я точно вспомню электро-гитару, просто гитару, бас-гитару, ну и барабаны естественно. На этом в принципе мои знания все.
Все это повлияло на тот подход который я быстренько организовал, в будущем можно его автоматизировать, так что дайте знать если есть желание сделать вызовы API и готового тг бота под это в следующей статье.
(еще один задел на статью XD)
Подход для написания промптов в Elevenlabs Music

TL;DR: мне было лень разбираться в том как писать промпты и тестировать, на что могло бы не хватить ресурсов, поэтому я решил попросить Claude и GPT сделать это за меня.
И да я обязательно давал ссылку на промптинг гайд выше в своем запросе в начале общения, это позволяет сразу же дать вашему
text-to-text
слуге нужный контекст для генерации промптов под ElevenLabs music.
А что генерим?
В примерах на оффициальном сайте не было песен в рок жанре и я понял, что это поле для проведения небольшого и субъективного тестирования на поршивость.
В моей голове звучали треки от Static-X, Refusal и почему-то я вспомнил про Casey Edwards, который делал музыку для DMC 5, так что целевые треки должны были приблизиться по звучанию к их стилю.
Также я попробовал генерацию на русском, которой я к сожалению не поделюсь, так как она делалась для близкого человека и личного для него пользования, но скажу так:
мне не понравилось, русский звучит хорошо, но ударения иногда хромают.
В целом если вы хотите делать русский рэп, то что-то годное вы получите, но учитывайте что качество будет ниже, чем на английском.
Тестируем
Генерим трек в стиле Refusal
Промпт:
An energetic, upbeat rock anthem with catchy guitar riffs, driving bass, and punchy drums. The mood is celebratory and rebellious, with a carefree road trip vibe. Bright electric guitar power chords mixed with melodic lead lines, steady upbeat rhythm, and a singalong chorus. Influences from early 2000s alternative rock and punk rock, with a touch of indie festival energy. Tempo around 140 BPM, major key, full band arrangement with electric guitar, bass, drums, and a hint of background vocal harmonies.
Результат:
Получился какой-то blink-182, что не было целью, поэтому давайте займемся улучшательством.
Промпт:
Aggressive revolutionary punk rock in D minor, 140 BPM, screaming male vocals with raw and rebellious delivery, heavily distorted electric guitar with crushing power chords, pounding drums with aggressive fills, lyrics about fighting against oppression and standing up for freedom, intense and defiant mood, hardcore punk energy, 3 minutes
Результат:
Ну и последняя попытка в стиле Refusal:
Aggressive revolutionary punk rock in D minor, 140 BPM, brutal screaming male vocals with throat-shredding delivery perfectly mixed with crushing instruments, heavily distorted electric guitar with devastating power chords and breakdown riffs, thunderous pounding drums with blast beats and aggressive double bass fills, explosive chorus with intensified screaming vocals about revolution and uprising, raw hardcore energy with seamless vocal-instrument blend, relentless and furious mood, 3 minutes
Ну ясное дело, что голос он ни коим образом не скопировал, да и ElevenLabs против явного упоминания реальных групп, исполнителей и песен, так что каждый раз вы будете получать другой результат.
Генерим трек в стиле Casey Edwards
Слушайте, да, это определенно не тот уровень голоса, игры на инструментах и просто магии, которую делают реальные исполнители, но за цену булочки получить треки такого уровня за минуту это реально круто. Просто послушайте что получилось ниже.
Тут я решил разогнаться и попросить Claude сгенерить прям готовый текст для песни с припевом, мотивами и прочим. Идея была в том, чтоб прям приблизиться к этому контексту игровой истории, проблемы и т.д. из DMC 5, поэтому Клоду пришлось попотеть.
Epic symphonic metal in E minor,
slow and melodic verses at 90 BPM building to explosive choruses at 150 BPM,
clean male vocals with mid-range tone and slight rasp,
smooth melodic delivery in verses with emotional depth,
choruses starting with short vocal phrase followed by massive
instrumental sections with orchestral crescendo and dramatic choir,
heavily distorted electric guitars with melodic lead lines,
thunderous drums with double bass patterns, cinematic and heroic atmosphere,
intense dynamic build-ups from calm verses to explosive
instrumental breakdowns, video game soundtrack energy, 4 minutes
Lyrics:
Verse 1:
We are the thunder that breaks the silence
Twin flames burning through the violence
One brother calls forth the crimson dawn
The other walks where light has gone
Born from chaos, forged in war
Two halves of something so much more
When darkness rises, when hope seems lost
We pay the price, whatever the cost
Chorus:
We are one!
*(Explosive instrumental section with orchestral crescendo and choir)*
Blood and thunder!
Forged in darkness, born from sun!
Hell that heaven'll make!
Two souls ascend!
Verse 2:
I am the shadow that leads the way
You are the light that breaks the day
Together we stand where angels fear
When demons whisper, we draw near
Power courses through our veins
Breaking through these mortal chains
Two souls merged but never tamed
In fire and fury, we are named
Chorus:
Bridge:
We are the storm that never dies
We are the fire that always rises
When the world falls into despair
Brothers united, beyond compare!
Cut through the night!
Burn with the light!
Nothing can sever what we are!
Fight with the might!
Reach for the height!
Together we'll go far!
Final Chorus:
Chorus я тут не стал дублировать именно в elevenlabs, так как там есть ограничения в 2ка символов, но моделька сама понял что от нее требуют, поэтому Chorus везде был одинаковым.
Результат:
Тут должна быть ссылка на Soundcloud, но видео в статусе "processing"
Второй вариант:
Epic symphonic metal in E minor, slow and melodic
verses at 90 BPM building to explosive choruses at 150 BPM,
clean male vocals with mid-range tone and slight rasp,
smooth melodic delivery in verses with emotional depth,
transitioning to powerful belting with gritty edge in choruses,
orchestral strings and brass arrangements,
heavily distorted electric guitars with melodic lead lines,
thunderous drums with double bass patterns, cinematic and heroic atmosphere,
dramatic choir backing vocals,
intense dynamic build-ups from calm verses to explosive choruses,
video game soundtrack energy, 4 minutes
Lyrics:
Verse 1:
We are the thunder that breaks the silence
Twin flames burning through the violence
One brother calls forth the crimson dawn
The other walks where light has gone
Born from chaos, forged in war
Two halves of something so much more
When darkness rises, when hope seems lost
We pay the price, whatever the cost
Chorus:
We are one!
*(Explosive instrumental section with orchestral crescendo and choir)*
Blood and thunder!
Forged in darkness, born from sun!
Hell that heaven'll make!
Two souls ascend!
Verse 2:
I am the shadow that leads the way
You are the light that breaks the day
Together we stand where angels fear
When demons whisper, we draw near
Power courses through our veins
Breaking through these mortal chains
Two souls merged but never tamed
In fire and fury, we are named
Chorus:
Two brothers rising, against all the odds
Fighting as one, defying the gods
Steel in their hands, fire in their eyes
Together they stand, together they rise
Two brothers! Two brothers!
United we fight, divided we fall
Two brothers! Two brothers!
Answer the call!
Bridge:
We are the storm that never dies
We are the fire that always rises
When the world falls into despair
Brothers united, beyond compare!
Cut through the night!
Burn with the light!
Nothing can sever what we are!
Fight with the might!
Reach for the height!
Together we'll go far!
Final Chorus:
We are one!
*(Extended instrumental breakdown with choir and orchestra)*
Blood and thunder!
Legends born from ashes torn!
Burning souls!
Side by side till the end!
Результат:
В стиле Static-X, The Only
Да, та самая легендарная песня из NFS Underground, которую я конечно же не пытался склонировать и переделать, но мне было искренне интересно как будет звучать Chorus (припев) этой песни, сгенеренный ИИшкой.
В общем мне тут вообще ничего не вкатило, но из чего то плюс минус ок, получился следующий трек, с таким промптом:
Industrial nu-metal in drop C tuning, 130 BPM, young aggressive male vocals with slight electronic enhancement, raw and energetic delivery with melodic undertones, heavily downtuned 7-string guitar with syncopated palm-muted riffs, electronic samples and synthesizer layers, pounding drums with industrial beats, dark and mechanical atmosphere, crushing breakdowns, lyrics about inner conflict and isolation, fighting against conformity and finding your own path, youthful fury and intensity, 3 minutes Chorus lyrics: You're trying to break me You're trying to take me This is the only way Give me what I need I'm done with lying I'm done with trying The only thing that's real is what I feel
Final Chorus
Ну вот уважаемый читатель, мы подошли к заключению и выводам.
В общем как магическая коробочка, которая на основе твоего текста, который перед этим сгенерила нейронка, эта моделька перформит достаточно неплохо.
Я уверен что best‑practices будут еще формироваться, улучшаться, но в текущей итерации это выглядит как интересное решение, которое делает крутые вещи.
Если вы понимаете музыку, хорошо разбираетесь в терминах и инструментах — для вас это просто прекрасный вариант, ваш промпт будет генерить скорее всего именно то, что хотите вы, поскольку вы лучше чувтсвуете контекст и лучше можете передать его в том виде, в котором его лучше передавать.
Для себя же я попробовал новый инструмент, поделился подходом по тому, как я его использовал и своими результатами. В общем и целом мне понравилось.
Мне очень зашло то, как получилось со стилями треков выше, но в последнем показаном статье треке (он был лучшим из 4-х) мне все таки чего-то не хватило и пока не придумал как улучшить его качество.
Спасибо всем за внимание, надеюсь моя статья была для вас полезной, если у вас остались вопросы, то welcome в комменты и голосовалку.
Комментарии (5)
panzerfaust
11.08.2025 03:52Чисто технически это впечатляет. Но эстетически все треки, кроме последнего, вызывают зевоту. Уху зацепиться не за что, сплошные клише. Ну и еще гитары с дисторшном звучат как из пережатого mp3, и панорама какая-то скукоженная.
Есть примеры, когда этим занимаются не гики, а профессиональные музыканты?
dot22
Безалкогольное пиво, резиновые женщины, генеративная музыка от AI.
Что дальше?