Сразу вкратце отвечу на заголовок: выбрал Suno, поскольку ему уступают Tad, Yolly и Udio.
Ещё сразу предупрежу, что для доступа к некоторым материалам статьи, вложенным из сторонних источников, может пригодится включенный VPN.
В этой статье поделюсь опытом сравнения разных ИИ-генераторов, а также интересными находками про них, которые открыл в процессе написания альбома с помощью ИИ. Подспудно упомяну как можно больше интересных с моей точки зрения технических подробностей о процессе создания песен с искусственным интеллектом (ИИ). Примеры песен будут не только из моего альбома.
Будучи QA-инженером по роду основной своей деятельности и любителем музыки, я не мог пропустить мем "Вася Тестировщик", на котором изображён трек-лист выдуманного альбома в жанре шансон. Вдохновившись, я решил реализовать этот шутливый замысел мемодела: воплотить картинку в звук.

Забегая вперёд, всё получилось. Альбом можно послушать на любой мыслимой медиа-площадке по мульти-линку: https://band.link/ItFunMusic01
Вот, например, этот альбом на Яндекс.Музыке:
Статистика альбома
Срок создания альбома (от идеи до публикации публикации):
1,5-2 месяца
Число песен:
18 = 15 из мема + 3 бонус-трека
Пользовательский опыт в Suno и других ИИ на начало проекта:
~1,5 года
Режим творчества:
вечерами после работы,
на выходных в свободное от семейных дел время,
иногда на обеде писал тексты
Постановка цели и задач
Цель проекта поставил так:
с помощью ИИ-инструментов сделать юморной музыкальный альбом в пародийной стилистике шансона* с песнями на русском языке.
*Тут нужно добавить негативный промпт: хоть для кликбейтности мной и выбран был русский шансон, им я не ограничивался изначально, подразумевая, что и другие более или менее родственные жанры будут замешаны в тесте альбома.
Задачи для реализации цели
Назову задачи этого моего проекта. Затем пролью свет на моё решение этих задач
-
Выбор ИИ-инструмента ✔️
Знакомство с ИИ-генераторами и первичный сравнительный анализ ✔️
-
Написание текстов песен и промптов
(в этой статье подробно решения этой задачи не коснёмся)Особенности работы с языками, в частности с русским ✔️
Дистрибуция (выкладка на площадки)
(в этой статье подробно решения этой задачи не коснёмся)
Выбор ИИ-инструмента
Сейчас рыноr AI-инструментов для генерации музыки и песен активно развивается, предлагая решения от простых генераторов коротких фрагментов музыки до полноценных ИИ-ассистентов для создания песен с вокалом. Популярные платформы позволяют создавать композиции по текстовым описаниям, с кастомизацией жанров, "настроения" звука и применяемых музыкальных инструментов. Большинство из них предлагают бесплатные пробные версии и royalty-free лицензии для коммерческого использования.
Оговорюсь перед погружением в детали, что для достижения цели (сделать песни) отсёк из выборки генераторы инструментальной музыки - Aiva, Boomy (+Loopmagic), Mubert, Soundraw и подобные.
Мой топ AI-генераторов песен
Suno
Yolly
Tad
Udio
Пионеры
Suno и Udio — это компании, разрабатывающие ИИ для генерации музыки по текстовым описаниям. Suno появилась чуть раньше - декабрь 2023, за ней последовал Udio - апрель 2024.
Tad и Yolly - менее известные проекты, тоже инструменты в сфере ИИ-музыки, позволяющие создавать песни. Они появились позже: в 2024–2025, нет точных дат основания.
Доминанта
Начну сразу с выбранного мной ИИ. На нём я написал альбом.
Suno.com лидирует по популярности в своей нише. Генерирует полные песни с вокалом из текстовых промптов. Делает генерации отличного качества в жанрах от доступной поп-музыки до какой-нибудь редкой разновидности progressive art metal. Однако стоит отметить, что сверхсовременные жанры и стили музыки, имеющие пока ещё мало представителей и официальных релизов, не будут генериться, потому как они не участвовали в массиве аудиоданных для обучения. Их ещё попросту не было в помине на момент создания модели. Я, в частности, тестировал относительно свежий танцевальный жанр - кубинский Reparto - но за много генераций так и не услышал в результирующих треках признаков Рэпарто: ритм румба клаве в партии снэров вместе c бас-бочкой не в сильные доли такта, все ударные электронные; такие структурные разделы песни как "дропы" с характерной нарастающей частотой снэров. Suno на запрос генерации Reparto многократно выдал мне обычный Reggaeton.
С континентом музыки ИИ угадал, но конкретную мою задачу по жанру не выполнил.
Ну, сам же какой-то там latino на берегу заказывал -
по итогу латино и получай, родной!(вольная интерпретация ответа Suno за запрос сделать Reparto)
Хорошо, что такие давние, укоренившиеся в умах лантино-американские жанры как бачата Suno знает и делает хорошо.
Впрочем, возвращаясь к теме этой статьи, русский шансон и родственные жанры - далеко не редкость в СНГ и русскоязычном сообществе. Нейросети действительно хорошо знакомы с "блатняком" и родственными жанрами.
Возможные причины этого: модели ИИ вроде Suno и Udio имели достаточно данных для обучения из релизах 1990–2020-х годов, включая миллионы русскоязычных треков ушедших и современных исполнителей шансона и родственных жанров (от А.Северного, М.Круга до Г.Лепса и Шамана). Не нашёл официальных данных, как именно учили ИИ-генераторы русскому языку и музыке, но предположу, что dataset нашего Интернета, достаточно развитого и богатого на пиратский контент, в 1990–2020-х годах содержал и содержит много шансона как российского, так и раннего советского. Оцифровывать магнитные ленты и бобины нам в РФ было не лень, а сервисы вроде zaycev.net, где до сих пор можно скачать mp3 популярного трека, существуют сколько я себя помню. Не исключено, что "русские вдохновения" Suno и иже с ним черпали в том числе из таких источников.
Если собрать открытые данные по поддерживаемым ИИ жанрам и ранжировать, то увидим следующее:
AI-генератор |
Количество доступных жанров/поджанров |
Примеры сильных сторон |
Примечание |
|---|---|---|---|
Suno |
>1200 |
K-pop, folk, future bass, flamenco |
Число официально заявлено; генерирует нишевые жанры типа "русский шансон 90-х" |
Udio |
~800–1000 |
Electronic, hip-hop, rock, metal |
Судя по моим экспериментам способен выполнить все задачи по созданию песен моего альбома. |
Tad |
~50–100 |
Pop, rock, electronic, folk, classical |
Есть риск, что не содержит нишевые жанры вроде русского шансона. |
Yolly |
~30–50 |
Pop, hip-hop, lo-fi, ASMR, cinematic |
Фокус на трендовых жанрах для соцсетей. Есть риск, что не содержит нишевые жанры вроде русского шансона. |
Данные основаны на документации и тестах сообществ 2024–2025 гг.
Реальное же "знание" жанров в ИИ зависит от качества обучения вокальных моделей, а не количества тегов.
Выглядит так, что именно для русского шансона больше подходят Suno и Udio.
Итак, сравнивать другие ИИ буду именно с Suno по причинам уже названным и ещё лучше раскрывающимся ниже.
Войны клонов
Другие же сервисы ИИ-генерации музыки в той или иной мере являются "догоняющими" клонами Suno как по принципу работы, так и по качеству звучания результирующих треков.
Как мы знаем из уроков экономики, здоровый рынок должен конкурировать. Из этого происходит много полезного, но главное, как считаю, - погоня за качеством.
Tad.ai - это AI-генератор музыки и песен, который создаёт royalty-free песни из текстовых промптов, может сам написать текст, предлагает немало популярных жанров (поп, рок, электронная) и настроений; использует модель Skymusic 2.0 для простого создания треков в сопровождение видео и подкастов.
Yolly.ai - мультиплатформа с ИИ-генератором песен и музыки с функциями создания вокала из текста (Text-to-vocal, аналогичной конкурентам), отделить вокал от аранжировки (stems), интеграции видео. "Йолли ЭйАй" делает фокус на royalty-free контенте для соцсетей и, конечно же, TikTok.
Udio.com - AI-генератор песен и музыки, создающий треки из текстовых промптов в любых жанрах; поддерживает итеративное расширение трека (extend), ремиксы, inpaint и Custom Mode. Ключевые возможности: генерирует 30-120-секундные клипы с вокалом/инструменталами, >20 языков, стемы/WAV на Pro; идеален для сложных структур и профессионального микса.
Общий принцип работы пользователя с ИИ-ассистентом
Ты ИИ-генератору слово -
он тебе в ответ два...
трека.
Работу с современными ИИ-ассистентами по созданию музыки можно свести к заполнению 1-2 текстовых полей в пользовательском веб-интерфейсе.

Также для гибкой настройки ИИ-генераторы предлагают возможность прощёлкивать и накручивать ряд тогглов и ручек.

Как правило, для создания ИИ-песни заполняется диада:
(1) текст песни
+
(2) промпт для определения стиля/жанра характера звучания будущей песни

Это необходимый минимум. Суммарно это и есть вводный промпт.
Далее творец жмёт "Создать" и тратит грошики credits. О них в следующем разделе.
Такая вот нехитрая промпт-инженерия в итоге генерации даёт каждые раз по два трека вам на строгий суд.

Кредиты (credits)
Credits - внутренний ресурс, монеты, "голда" у ИИ-генераторов музыки.
После авторизации все платформы дают на пробу ограниченное число генераций треков за кредиты. Тут, как и во многом, Suno задала тренд; например, стартовую величина внутренней валюты - 50 credits, которая выдаётся пользователям для генераций, одинаковая в Suno и Tad.

На 1 генерацию по диаде [текст песни + промпт] затрачивается 10 кредитов.
Tad унаследовали эту механику едва ли не точь-в-точь. Пришёл, сгенрил 2 раза по 2 трека - осталось 30 кредитов.

5 раз кликнул "Create", получил 10 треков по своим 5 промптам, и выгреб все кредиты.
В Yolly и того меньше - 30 стартовых кредитов = 3 потенциальные генерации.

В Yolly историю начислений и трат кредитов можно посмотреть кликнув по балансу.

Ощутимое отличие системы кредитов у Yolly и Tad от Suno в том, что ваши кредиты не возобновятся каждый день до оплаты подписки. В этом отношении Suno пощедрее: обновляет счётчик до 50 ежедневно. Не в этом ли секрет получения лояльности пользователей? Ответ: да, в этом, но не только.
У Udio отличается способ генерации и траты кредитов. Генерации стоят дешевле: 2-4 кредита, хотя и результат в Udio - всегда не полный трек, а фрагмент. А на полный может уйти куда больше 10 кредитов.
В каждой избушке
свои погремушки(народная мудрость)

Дефицит кредитов в Suno перестаёшь чувствовать после покупки подписки, когда тебе выдаётся 2500 кредитов на месяц (в случае Suno). Однако купить из РФ подписку сейчас не так-то просто. Я покупал подписку дважды (месячную и годовую) с помощью друзей, владеющих картами иностранных банков: Казахского и Тайского. С Кыргызской карты не получилось оплатить. Знаю, что есть сервисы для оплаты подписки Suno. Сам пока не пробовал, поэтому рекомендаций давать не буду.

Пристрастились к созданию песен через ИИ?
Уже нужно больше кредитов?
Идём смотреть...
Подписки
Данные, которые привожу, актуальны на момент публикации статьи - начало 2026 года.
Экономика подвижна, цены и условия меняются со временем. Зафиксирую в скриншотах текущие условия четырёх сравниваемых ИИ-продуктов, а затем сравню в сводной таблице.
Рассмотрю месячные планы, так как сам в Suno аккуратно начинал именно с такого.




Таблица со сравнительной характеристикой условий подписки 4-х ИИ-генераторов
В этой таблице сравним ключевые условия подписок с веб-страничек /Pricing производителей сервисов по ИИ-генерации.
Для удобства сравнения посчитал для всех подписок, сколько кредитов пользователь получает за 1$:
где credits - число предлагаемых в подписке кредитов;
price - цена подписки с официального сайта ИИ-сервиса.
Поскольку расчёт экономический, сотые не особо важны. Округлим Crper 1$ до целых.
Этот параметр определяет способность пользователя генерировать треки: больше кредитом - больше генераций.
Назовём параметр Crper 1$ - ценность подписки и сравним ценности, затем развесим медали ???️ самым выгодным предложениям.
Затем наградим победителя ? народной любовью.
Параметр \ ИИ |
Suno |
Yolly |
Tad |
Udio |
|---|---|---|---|---|
Бесплатный план |
50 кредитов/день (~10 песен), некоммерческое пользование, водяной знак |
3–5 генераций/мес с водяным знаком, базовые модели |
50 кредитов, стандартные фичи, коммерция, референс-аудио |
100 кредитов, |
Низкий Pro (цена/мес) |
Pro: $10, 2500 кредитов (~500 песен) Crper 1$ = 250 ? |
Starter: $9.90, 300 кредитов, все модели музыки/видео Crper 1$ = 30 |
Standard: $8, 500 кредитов (~100 песен, 3 задачи параллельно) Crper 1$ = 63 |
Standard: $10, 2400 кредитов (~1200 песен) Crper 1$ = 240 ?️ |
Средний Pro (цена/мес) |
- |
Standard: $19.90, 1200 кредитов не коммерческое пользование Crper 1$ = 60 |
- |
Pro Unlimited: $20, 5000 кредитов (~2500 песен) Crper 1$ = 250? |
Высокий Pro (цена/мес) |
Premier: $30, 10000 кредитов (~2000 песен) Crper 1$ = 333? |
Premium: $49.90, 6000 кредитов коммерческое пользование Pper gen = 120 |
Pro: $24, 2000 кредитов (~400 песен, 6 задач) Crper 1$ = 83 |
Pro Max: $96/год, 30000 кредитов/год (~15000 песен) Crper 1$ = 313 ? |
Коммерческое использование |
Да (платные), лимиты на монетизацию |
Да (музыка/видео), lossless download |
Да (все планы), royalty-free |
Да (платные), стемы/WAV, партнёрства UMG/WMG |
Кредиты на песню |
~5 кредитов/120с песня |
~5 |
5 кредитов/песня |
~2 кредитов/130с клип |
Языки вокала |
>50 |
~10–15 (русский, английский) |
>50 (мультиязычный) |
>20 |
Ключевые фичи |
Стэмы, extend, V5 вокал, >1200 жанров |
Vocal Remover, видео-интеграция, все модели |
ChatGPT-промпты, лирика DeepSeek, вокал-модели |
Custom (Seed/Clarity/Strength), Inpaint, ремикс |
Макс. длина трека |
До 4 мин (+extend) |
До 10 мин |
Не указано (~2–4 мин) |
До 7 мин (extend) |
Форматы экспорта |
MP3/WAV, стемы на Pro |
MP3/видео, lossless |
MP3 (royalty-free) |
MP3/WAV/стемы на Pro |
Доп. преимущества |
Ежедневные кредиты, |
Приоритетная поддержка, шаблоны |
Конкурентные задачи, референс-аудио |
Безлимитные extend на Pro, API |
Несмотря на то, что Suno в Premier подписке выдают наибольшую ценность, Udio ?предложили потенциальным клиентам наибольшее число предложений с высокой ценностью. Заметим, что введённый нами параметр Crper 1$ не показывает функциональность и отзывчивость ИИ-сервиса и победа Udio в этом нашем состязании означает только, что Udio - самый выгодный для клиента сервис по числу покупаемых генераций, то есть клик по кнопке "Создать" суммарно самый дешёвый.
У молодых сервисов Yolly и Tad ценность подписки низкая, то есть бизнес-аналитики завысили стоимость кредитов (overprice). Иными словами, Yolly и Tad денег просят много за малое число функций в коробке. Хорошо, что у вас есть я, который оценку сделал не по этикетке, а приоткрыв коробку и рассмотрев содержимое. :D
Мне довелось проверить платную версию Suno и бесплатные версии всех 4-х продуктов.

Отдельный интерес представляет сравнение цен и функционала веб-версии и мобильного приложения от разных производителей.
Например, для Udio я увидел в Google Play приложение Udio MusicLab. После установки по брендингу приложение несколько обособляется - везде фигурирует только MusicLab без Udio и сам интерфейс отличается. Также есть версии, "примазывающиеся" к тому или иному бренду. Это выделим и прокрастинируем в отдельную статью про сервисы-фейки ИИ-генераторов и сервисы, использующие явно и неявно API крупных игроков этого сегмента ИИ-рынка.
Стратегия покупки подписки
Поупражняться до подписки можно и на бесплатных триалах почти любого ИИ-генератора, делая "черновики". Затем эти же черновики можно доработать в лучшем качестве в платной версии. Начинать лучше всего с бесплатных версий Udio и Suno; именно в таком порядке.
В целом считаю подписку Suno стоящей своих денег (~8К руб./год).
Если решились на первую подписку, начать лучше с месячной.
Покупать подписку любого уровня рекомендую тщательно спланировав, сколько и какие вам нужно сделать треки, то есть имея некий задел - набор идей / демо-записей / текстов песен любого уровня готовности.
Также надо понимать, что купив подписку, вам нужно будет выделить ваше время на занятия с Suno, чтобы эффективно потратить ваши кредиты. Так для Pro-подписки в Suno выделяется 2500 кредитов в месяц. Мне их вполне хватало на реализацию всех многих моих идей и экспериментов. Пару раз даже оставались недоиспользованные к концу месяца кредиты. Однако было бы обидно 1500 кредитов отправить коту под хвост, сгенерив только на 1000.
Лабораторные работы
Начнём исследования с Udio. Музыка у Udio в результате генерации стилистически соответствует промпту. Голос вполне человеческого тембра, однако Udio нуждается в более подробном изучении перед началом использования и более кропотливой настройке генерации. И - что печально - качество песен Udio всегда ниже песен из Suno. Для точности отмечу, что я оценивал аудиотреки из Udio, сделанные на последней версии модели бесплатного плана, то есть без подписки.
Вместо тысячи слов для сравнения Udio с Suno я сгенерировал с помощью обоих ИИ песню с промптом и текстом песни, один-в-один совпадающими.
версия Udio (v1.5 Allegro) или тот самый "первый блин":
версия Suno (v5) :
(эта версия звучит в опубликованном альбоме)
Нужны ли дополнительные комментарии после этой демонстрации?
У Udio доступны 3 модели; во всяком случае в бесплатной версии для авторизованных юзеров. Есть ли при подписке в доступе модели посовершенней? Не знаю наверняка. Во всяком случае, о них на веб-ресурсе Udio не заявлено.

Suno же конкурируя ещё до любых подписок предлагает пользователю кроме устаревших - модель 4,5-all. Эта модель хорошо мной опробована, вполне работоспосомбна, реалистично звучит, русская фонетика в первых генерациях на четвёрочку. Не на 5, потому что регулярно нужно было править песни по ударениям и некоторым другим багам.

Версия v4.5-all хорошо пропатчена и сбалансирована. Пруфы в виде истории артефактов и их правок на примере моих песен и их ремастеров внутри Suno представлю в одной из следующих статей на Хабр про баги, ляпы, недочёты Suno и, конечно, их своевременные правки.
Языки в исполнении ИИ
Я, как переводчик по второму диплому, с пристрастием протестировал в Suno порядка 10-15 языков разных языковых групп: en-US, fr-FR, es-ES, it-IT, pt-BR, de-DE, jam-JM, 3 славянских, казахский, китайский, корейский, хинди, 1 африканский и ещё некоторые редкие. Из экстравагантных - одну песню с использованием санскрита написал, наскоро проверил фонетику по лингвистическим воссозданиям. Выглядит и звучит убедительно. А вот с древнерусским, кстати говоря, Suno не справился. Вот и границу по языкам нащупали: Suno умеет в живые/современные языки, а в умершие/древние - не всегда.
Согласно официальным источникам, Suno имеет поддержку 60 языков мира и с первой генерации на русском даёт годный, но не идеальный результат. Udio же, при неумелом подходе звучит будто только подражает русской речи, сохраняя только её просодику, не произнося правильно большинство слов, что очевидно из примера выше. Однако ниже есть пример, где Udio весьма недурно справилась с произнесением русского текста. В генерации через Udio решает опыт правильной предварительной настройки.
Сам русский язык в исполнении Suno от генерации к генерации звучит неравномерно по фонетике: в иных жанрах наблюдаем чистейшую артикуляцию, чистый голос Voice (см. ниже). В жанрах афрокубинской музыки я заметил послабления в артикуляции (mumbling - мямленье на речитативах), свойственные больше испанскому языку.
Слово "последний" произнесено как "бос(з)лений". Явление неточности в парах согласных "звонкий-глухо" нередко.
В промпте песни выше: The song is a fusion of melancholic Cuban Timba and Blues-Rock. Cuban Timba подразумевает нестрогую певческую артикуляцию в манере испанского языка (латиноамериканского (кубинского) диалекта).
Если подкреплять тезис про неравномерность артикуляции по жанрам, то хороший пример в этой песне:
К песне приходится прислушивается из-за подмямливания в произнесении. Какие могут быть тому причины?
В промпте песни выше: A gritty modern Russian folk song.
Под современное русское народное хорошо замаскированы современные жанры, родственные русскому шансону жанры (впрочем и старый добрый "блатня" любил позаигрывать с темой народности). Такие популярные в сегменте исполнители как, наприер, "Баста", "Нурминский" и "Крёстная семья" несут в своём творчестве именно такие интонации и артикуляцию, а новые модели ИИ обучаются на популярной музыке студийного качества со стриминговых платформ.
И раз уж, раскрыв немного вопросы языка, мы коснулись качества, то обозрим же его подробней.
Таблица со сравнительным анализом функций качества генераций 4-х ИИ для создания песен
Оценю ключевые качественные характеристики по 10-бальной шкале, а также сравню важные для меня функции по наличию. К некоторым оценкам хочется дать развёрнутый комментарий и дополнительно их поисследовать, поэтому у них есть сноски0 :-), раскрываемые под таблицей.
Характеристика \ ИИ |
Suno? |
Tad? |
Udio? |
|
Интерактивное обучение в UI |
8 ? |
- |
- |
5 |
Простота освоения |
7 |
8 |
9? |
6 |
Релевантность вокальной дорожки к задаче в поле "Lyrics" |
9 |
8 |
9 |
6 |
Голос (Voice) * |
8 |
8 |
8 |
7 |
Работа с языками |
9 ? |
5 |
41 |
6 |
Релевантность аранжировки |
10 ? |
8 |
10 |
7 |
Качество аранжировки, |
9 |
9 |
9 |
6 |
"Гибкость" настроек панели для создания трека |
8 |
7 |
5 |
9 ? |
Скорость генерации |
9? |
8 |
6 |
7 |
1 Tad принимает из буфера обмена только латиницу в поле с текстом песни в поле Lyrics. Кириллица "режется": не вставляется из буфера обмена. English - превосходен. В этой статье я на примере конкретной цели даю оценки, и - раз в помощь русскоязычному автору нельзя сделать песни стандартным способом - моя оценка 1.
Чтобы посмотреть, на что способен Tad, сгенерим наш c друзьями давний трек на английском с тем же текстом и промптом, что некогда я создал в Suno:
У Tad не предусмотрен механизм share для интеграции (embedding), поэтому запись я разместил на Soundcloud. Оригинал текста и промпт можно посмотреть на сервере tad.ai ?:
Сравним с оригиналом в Suno - тот же текст + промпт:
Это ИИ-кавер ☝️, то есть музыка для референса взята оригинальная (проект Amakan, в котором я участвую). ИИ переделал песню, опираясь на оригинал.
Раз речь зашла о хип-хопе на английском, предлагаю ещё сравнить c голосом, сгенерированным в Yolly:
У Yolly, как и у Tad, не предусмотрен механизм share и интеграции (embedding), поэтому запись я разместил на Soundcloud. Оригинал текста и промпт можно посмотреть на сервере tad.ai ?:
Увы, здесь ☝️ не тот же текст и промпт, что в треках выше, так как на момент написания этого абзаца кредиты Yolly на нуле.
Не успел в Yolly затестить русский, когда кредиты уже закончились, но, как показывает общая практика генераций песен в ИИ, если английские тембры голосов - ОК, то русские с тем же промптом будут неплохи. Кириллица в Yolly принимается (не в пример Tad).
И, чтобы уж закольцевать череду сравнений на привередливом до кириллицы Tad, с которого начат круг, взял промпт и текст выше из Yolly и совершил генерацию в Tad:
Оригинал текста и промпт можно посмотреть на сервере tad.ai ?:
* В таблице выше я решил ввести комплексную метрику Voice для удобcтва оценки. Голос (Voice) - сумма качеств приятности на слух и правильности на восприятие, а, если более точно, сумма субъективных качеств корректности и уместности в отношении артикуляции Artc, красоты тембра Tmbr и чистоты интонирования Intn вокала, которую слушатель явно улавливает в записи с голосом (record). Если пробовать приближённо выразить характеристику Voice , используя математическую графику, можно написать так:
Оценивая Voice - всё как и в жизни,- снижаем по нашему усмотрению баллы, если есть ошибки: роботизированный голос (не заданный в промпте автотюн), артефакты произношения (потерянные согласные/гласные звуки, слоги, строки), откровенно грязно спетые ноты (и притом неуместные для жанра, не задуманные промпт-инженером).
Voice в известной мере субъективный для слушателя показатель. Voice зависит от культурного уровня слушателя, диапазона его аудиального опыта. Считаю, что есть накопительный эффект внимательного слушания треков (не только ИИ-песен), когда концентрируешься на характеристиках голоса вокалиста и в итоге можешь всё более объективно его оценивать. Например, для массового слушателя может быть очевидно
Voice(Ф.Меркьюри) > Voice(Б.Гребенщиков).
Первично исследуя возможности Udio, я открыл для себя, что несмотря на слабый Voice в первой моей неловкой генерации через вкладку Create с текстом песни и промптом (слушай пример выше), Udio выдаёт сразу весьма приемлемый Voice при генерации во вкладке Playground (игровая площадка). И это достигается всего в 3 клика и вставкой заготовки идеи для песни (4).

Послушайте сами, какая красота получается! Оцените Voice:
Промежуточный вывод:
Udio не сильно, но всё же уступает Suno по "эрудированности" в жанрах, раз Udio можно сломать промптом на какой-нибудь не самый популярный жанр вроде dark cabaret.
Тем не менее, когда ты отыскал "знакомый" для Udio жанр, уже вполне можно надеяться на успех генерации.
Также на качество голоса в треках Udio влияет длина первичной генерации и продолжений этой заготовки (extend). Лучше всего ставить время поменьше, идеально tsec min=32''.
Справедливости ради замечу, что у Udio панель расширенных настроек богата прелюбопытными фичами. Иные бы и в Suno не помешали. Рассмотрим и сравним панели расширенных настроек генерации Suno и Udio.



Хочу обратить внимание, что при выставлении Song length (2) на уставку 32 секунды добавляется настройка (9) Lyric Timing с возможностью изменить с Auto автоматически выставленное время вступления вокалиста в секундах. Аналогично время умолкания вокалиста на генерируемом эпизоде.

При том что у Udio самая демократичная цена за генерацию - 2 кредита. При активации панели расширенных настроек цена генерации вырастает до 4х кредитов. Так мы косвенно понимаем, что разработчики Udio осознают ценность этих дополнительных опций.

1. BPM - темп трека в ударах в минуту. Сложно переоценить важность этой настройки, когда знаешь какой темп хочешь в точности. Хорошее бесплатным не бывает. Нажмёшь тоггл - и уже баннер канючит переключение на Pro-версию. Эту фичу и любитель-битмейкер, и профессиональный композитор в студии бы оценил. Такого нет в текущей версии Suno.
2. Song Length - в Udio (free) всегда 2:10 "в прыжке". Однако можно и снизить, что может быть полезно в современном мире быстрого контента (TikTok, reels, YouTube Shorts и пр.). Нет в Suno.

3. Clip Timing в Udio — это весьма хитрая настройка. Этот параметр в расширенных настройках генератора определяет позицию генерируемого клипа (фрагмента) внутри общей структуры песни. Он позволяет вручную указать, является ли клип началом, серединой, концом или промежуточной частью (например, куплетом, припевом или проигрышем), чтобы модель адаптировала стиль, темп и переходы соответственно.
В автоматическом режиме (Auto) Udio сам выбирает позицию на основе промпта стиля и стиха, часто устанавливая значение около 40% для куплета или припева. Ручной режим (Manual) дает возможность гибкого контроля: можно задать диапазон в секундах (от -6 до +6 сек относительно центра клипа), чтобы разместить элементы вроде интро или аутро в нужном месте трека.
Этот параметр полезен для создания плавных переходов без резких начал/окончаний, особенно в 2-минутных моделях — генерируйте "середину" и расширяйте (extend) для полной песни. Рекомендуется сочетать с лирикой и промптами для точного позиционирования, избегая экстремальных значений, чтобы сохранить согласованность и логическую связность элементов трека.
4. Style Reduction - негативный промпт, запрещающий ИИ использовать не желаемые пользователем жанры, аспекты, инструменты, характерные черты (например, жанр trap и/или автотюн, выкрики Тимбалэнда "Э!" в инструментальных разделах). Точно такой функционал есть в Suno, называется 'Exclude styles'. Как вы думаете, можно ли найти это у младших братьев - Tad и Yolly? Ответ: нет
5. Prompt Strength - влияние промпта в процентах. Насколько влияют на результат пожелания пользователя в поле "Describe Your Song" (описание жанра, стиль). В моих сравнительных тестах с 50% (по умолчанию) Udio добавило от себя "альтернативный рок" и в итоге в припеве есть гитары с дисторшном, так что параметр нужный. Насколько он действенный я не проверял тщательно. В Suno есть аналог, шкала 'Style Influence'.
6. Lyrics Strength - это параметр, который регулирует степень соблюдения заданному тексту песни. Нет в Suno, а не помещало бы.
Значение |
Эффект |
Пример |
|---|---|---|
0–30% |
ИИ креативит: меняет слова, пропускает строки, импровизирует |
Ввод: "За решёткой сижу" → Вывод: "В камере холодной сижу я..." |
50–75% |
Сбалансированный: ~90% текста сохраняется, звучит естественно |
Ввод: 4 строки → 3.5 строки в песне |
100% |
Дословно: поёт ВСЕ слова без изменений |
Ввод = Вывод Риск: "роботизированный" вокал |
7. Clarity - параметр, регулирующий чистоту звучания и разделение инструментов в генерируемом треке. Нет в Suno.
8.Seed - интереснейший числовой параметр, который служит "начальным ключом" для генератора случайных чисел в алгоритме ИИ, обеспечивая воспроизводимость результатов. Этот параметр оказался для меня самым непонятным и одновременно создавшим wow-эффект при его изучении. Поэтому о нём нужно написать поподробнее.
Как работает Seed?
Значение по умолчанию: -1. Каждый раз генерирует случайным образом уникальный seed - разные результаты при одинаковых промптах. Seed конкретного трека можно будет узнать, об этом далее.
-
Фиксированный номер Seed (например, 47662): С теми же seed, промптом, словами песни и настройками (Clarity, Strength) всегда по задумке выходит идентичный трек - идеально для экспериментов и повторений. Проверим?
Дважды сгенерировал c Seed=47662, едва поменяв соседние настройки => дважды получил голос Бориса Гребенщиова ??
Выкладки из Udio могут потребовать VPN и прокликивания согласия на сбор сайтом cookies. Но достучаться до кнопки PLAY возможно. Это проверено.
Совпадение?
Используйте для тонкой настройки: найдите "хороший" seed на коротком клипе, зафиксируйте и расширяйте песню без потери согласованности элементов трека (coherence).
Seed копируется из удачного трека (в редакторе песни) для дальнейшего применения функций расширить(extend), а также сделать remix с сохранением голоса.
В третий раз сгенерировал c SeedБ.Гребенщиков=47662, заметно поменяв соседние настройки, в третий раз получил почти одинаковую аранжировку и тот же голос ???
В последующих сессиях этот фокус с Seed не удалось повторить ?. Возможно какой-то из параметров сыграл решающую роль. Фича нуждается в дальнейшем исследовании.
Если вдруг случайно нагенерите в Udio интересный голос, seed голоса можно найти и сохранить в буфер обмена, перейдя, например, в детали по треку:
в плейлисте генераций правой кнопкой мыши по треку -> Song Details

Далее жмём "Copy Seed", и душа Самойлова голос в вашей коллекции.

SeedГ.Самойлов=165706276. Не благодарите!
Пожалуй, интересно будет узнать находки читателей статьи. Быть может, вам в Udio выпадет Цой, Луи Армстронг, Шакира или Оливер Сайкс.
Из таких находок и отдельный словарик с seed'ами можно было б сделать и опубликовать, не так ли?
Отмечу дополнительно, что Udio предлагает в платной версии в лоб сохранение голоса. Ничего сказать про эту функцию пока не могу. Тестировал только триал Udio.

Функция "Copy Seed" в Udio близка к "Make persona" в Suno. Но не идентична. В Suno "под капотом" эта функция работает хуже и не консолидирует голос из найденного источника (как seed в Udio), а снимает всего одну пробу стэма вокала длиною 5-20 секунд. Имея опыт сбора моделей голоса, должен упомянуть, что этого сильно мало. В идеале собирать нужно чем больше тем лучше (30-80) кусочков вокала, каждый по 5-8 секунд. Ещё лучше, если для референса используется студийная a capella в хорошем качестве.

Промежуточный вывод:
- Из-за того, что Suno берёт недостаточно проб вокала, модель получается неточной копией по звучанию.
Обращусь к примеру из песни, где в Suno рандомно(+/-) получился голос Тиля Линдемана из Раммштайн:
Создание "персоны" Suno дало очень отдалённо напоминающий голос Тиля. Обновление персоны до v5 не помогло. Удаление же этой записи персоны и лишило меня персоны, и повторной возможности создать персону. Недавно Suno презентовала возможность применять из одного экземпляра Persona либо голос, либо стиль аранжировки. Второе - по сути переиспользование того же промпта, что в оригинале. Эта возможность уже была в Suno ранее в другой кнопке Reuse style. Что ж, будем держать руку на пульсе этой фичи. Пока она занимательна, но толком неприменима.
Промежуточный итог: Persona в Suno даёт низкую воспроизводимость референсного голоса. Происходит это по причине взятия малого датасета: берётся только одна проба голоса на 20-30 секунд, вместо необходимых по открытым данных 80-100 проб по 5-8 секунд из стэмов голоса,- именно так берутся модели голоса. Впочем метод воспроизведения через Seed в Udio оказался также не особо эффективным. Во всяком случае нестабильным.
Говоря об уникальных фичах, в расширенной (advanced) панели Suno против панели Udio выделяется ползунок Weirdness.

Weirdness в Suno регулирует уровень экспериментальности и хаоса в генерируемой музыке.
Как это работает?
При 0% модель придерживается строгих, предсказуемых паттернов — безопасный, структурированный звук, близкий к промпту.
На 50% добавляется креативность: неожиданные гармонии, грув и вариации для интересных идей без потери сообразности задумке автора (coherance).
При 100% — полный хаос: breakcore, странные эффекты, нестандартные структуры. Идеально для вдохновения, но часто непредсказуемо.
60–80% — золотая середина для баланса оригинальности и качества; комбинируйте с Style Influence для точного контроля. Доступно в v4.5+ на Suno для поиска освежающих идей в создании песен.
Сравнение ИИ по насыщенности функционалом
Сведём в ещё одну сравнительную таблицу наличие ключевых функций по генерации песен, а также их особенности, заявляемых производителем.
Функция \ ИИ |
Suno |
Yolly |
Tad |
Udio |
|---|---|---|---|---|
Возможность генерить всю песню целиком сразу |
Да |
Да |
Да |
Нет |
возможность загрузить демозапись для обработки |
Да, free |
Да, free |
Да, pro |
Да, pro |
Возможность сослаться на трек на других платформах |
Да |
Нет |
Нет |
Да |
Возможность переиспользовать звучание конкретного трека |
Да, |
Нет |
Нет |
Да, |
Возможность записать материал в микрофон |
Да |
Нет |
Нет |
Нет |
Редактор |
Да, Pro |
Нет |
Нет |
Да, Pro |
Встроенная студия |
Да, Premier |
Нет |
Нет |
Нет |
Загрузить аудио-референс пользователя |
Да |
Да |
Да |
Да (Cover/Remix из аудио) |
Extend (расширение трека) |
Да |
Нет (фиксированная длина ~10 мин) |
Нет |
Да |
Remix |
Да |
Да |
Да |
Да |
Cover (каверы) |
Да |
Нет |
Да |
Да |
Время на 1 генерацию |
30–120 сек |
60 сек (видео+музыка) |
30–60 сек |
~10–30 сек |
Расширенныепараметры |
Weirdness, Style Influence |
Нет |
Жанр/настроение, ChatGPT-промпты |
Seed, Clarity, Lyrics Strength, Prompt Strength |
Автоматизированное написание поэзии (текста) |
Да |
Да |
Да |
Да |
Стемы/разделение |
Да |
Да |
Нет |
Да |
Макс. длина |
4 мин |
10 мин |
~2–4 мин |
7 мин |
Генерация аудиокниг (spoken word) |
Нет |
Нет |
Нет |
Нет |
Создание инструментальной музыки |
Да |
Да |
Да |
Да |
Генерация поэзии |
Да |
Да |
Да |
Да |
Персональные голоса |
Да |
Нет |
Да |
Да |
Языки вокала |
>50 |
~10–15 |
>50 |
>20 |
Интеграции |
API (Pro) |
Видео/изображения |
Вокал-модели |
API (Pro), Inpaint |
ASMR/специальные эффекты |
Частично (через промпты) |
Да |
Нет |
Да |
Предел параллельных генераций |
Нет, |
Нет, |
До 6 параллельных задач (Pro) |
До 10 параллельных (Pro) |
Так кто лучший в итоге?
Каждый ИИ хорош в своём.
Не знаю почему точно, но мне даже самому для себя напоследок хочется приподнять отстающую в моих рейтингах Udio, утешить получателя "деревянной медали" в этих моих импровизированных соревнования ИИ-генераторов.
Я нахожу всё больше плюсов у Udio, пионера среди ИИ-генераторов. Тем более, что к моменту окончания работы над этой статьёй я таки-нащупал, как писать музыку с Udio, и понял, что в альбом вполне себе могла войти парочка песен из Udio:
Ещё в Udio есть крайне удобная фича при работе с текстом: по слешу "/" открывается всплывающий список со всеми(!) возможными типами разделов в песнях:

Таким образом, лишь слегка коснулись в этой статье темы написания промптов в ИИ-генераторах. Это обсудим позднее отдельно. И не только это.
Каких интересных тем эта статья коснулась, но не раскрыла?
Нарочно, чтобы не перегрузить статью и читателя, интригуя, оставляю нераскрытыми такие смежные темы:
написание текстов песен (с- и без ИИ);
механизмы антиплагиата, встроенные в Suno и другие ИИ, и как их обойти;
эволюция в создании своего звука - улучшение и усовершенствование своих живых песен и демо-записей вместо сведения и мастеринга по старинке;
мой разбор гармонии (аккордов) песен, сделанных ИИ и работа ИИ с предлагаемой пользователем гармонией песни.
мой выбор дистрибутора музыки и процесс выкладки песен альбома на медиа-площадки, возможности и опции;
анализ вопроса авторских прав и обязанностей применительно к ИИ-творчеству;
-
обработка иностранных языков (нерусский);
![Экран из Music Lab [ мобильное приложение от Udio(?) ] Экран из Music Lab [ мобильное приложение от Udio(?) ]](https://habrastorage.org/r/w780/getpro/habr/upload_files/91a/b08/c16/91ab08c163b6ac7cf5f94c0606bae8e1.png)
Экран из Music Lab [ мобильное приложение от Udio(?) ] - мобильные версии приложений.
С таким TODO-листом я и уйду в новый год, друзья!
Уйду, чтоб вернуться :)Но пока что нужно подытожить.
Вердикт и выводы
Вердикт: Suno is the best at last ?
Думаю, обоснований и привёл достаточно. Понятность и качество генераций и доступная цена суммарно превалируют над немалыми достоинствами опытного гиганта Udio и малышей Tad и Yolly.
Мои скромные выводы из опыта написания альбома с ИИ и сравнения разных ИИ-генераторов такие:
-
Пока писал альбом, появлялось немало желаний, сомнений и идей про ИИ-генераторы.
Сам процесс написания альбома помог лучше изучить ИИ и сравнить.
-
Основательно я сравнил все 4 ИИ уже после написания альбома. Перед написанием я сделал выбор из Suno и Udio в пользу первого.
Udio в моём арсенале мог бы значительно обогатить альбом, если бы я его задействовал. Причина: у Udio свой опыт обучения и свои алгоритмы генерации треков, следовательно, своя уникальная изобретательность.
-
Есть простой метод протестировать и сравнить ИИ-генераторы песен - сгенерировать треки из абсолютно одинаковых промпта и текста и прослушать, прогнав оценку по таблице параметров из этой статьи.
Метод становится тем актуальнее, что число новых ИИ-генераторов на рынке прирастает. В течении 2025 года наблюдал появление отечественных сервисов, в открытую заявляющих, что опираются на API Suno или же скрывающих свой "движок". Также видел новости о разработках отечественного конкурентного продукта (в РФ).
-
На момент, когда я приступил к созданию песен альбома, я был знаком с Suno и Udio. И уже сделал для меня очевидный выбор в пользу Suno.
Сейчас, исследовав более детально предложения рынка ИИ по написанию музыки, я только утвердился в своём выборе ИИ-генератора для написания песен. Утвердился, прежде всего, из-за сочетания высокого качества звучания финального трека, достаточной гибкости в настройках и продвинутых языковых алгоритмов Suno.
-
Однако также я понимаю, что можно грамотно комбинировать разные ИИ-генераторы за счёт перезалива генераций из одного ИИ-ассистента в другой. Таким образом, можно применить сильные стороны одной ИИ в комбинации с другой.
Комбинировать стэмы разных ИИ пока сложно из-за отсутствия жёстких вводных параметров BPM и тональности (key). Однако на это можно повлиять через одинаковый загружаемый в ИИ reference-трек.
-
В условиях доминирования Suno небессмысленным остаётся мониторинг рынка ИИ-генераторов. У разных ИИ-ассистентов при конкурентоспособном уровне качества итоговых песен для создания есть свои уникальные функции.
Генеральный вывод: ИИ всё больше крепчает, как инструмент для написания музыки и песен. Вижу в ИИ много перспектив и буду продолжать наблюдение.

Дмитрий Исанин
Тестировщик ПО, переводчик, поэт-песенник (автор текстов и, к сожалению, музыки; в моей команде меня саркастично сравнивают с Эдуардом Суровым), изучаю и применяю ИИ для создания песен и музыки 1,5 года
Я очень рад, что написал эту статью.
Также буду несказанно рад, если мой пародийный альбом "Две ходки по канбану, одна - по фану" улыбнёт коллег в разных местах мира, ведь все мы время от времени бываем Васей Тестировщиком.
https://t.me/shine_sean/767 ← по этой ссылке на мой Телеграм-канал вы подпишитесь и найдёте поздравления и пожелания на 2026й год, а также новогодний альбом с оленьими ИИ-каверами, снежными переделками известных песен (а их из-за проблем с авторскими правами не выложишь официально так просто) и, конечно, моими собственными новогодними песнями.
Также я есть
YouTube: https://www.youtube.com/@dmisanin
ВК: https://vk.com/dmisanin
Живите и поступайте по совести! Имейте честь! Успехов во всём!
С новым годом! ??? ︎?????