Привет, Хабр!
Я – Михаил Суворов, технический менеджер продуктов искусственного интеллекта X5 Tech.
В статье я расскажу про наш кейс создания персонализированных баннеров с помощью ИИ.
Персонализация — не тренд, а необходимость
Мы начали с очевидного: универсальные баннеры больше не работают. Люди привыкают к однотипной рекламе и перестают её замечать. А вот персонализированные предложения — те, которые выглядят уместно и говорят на языке конкретного человека — всё ещё привлекают внимание. Когда баннер «попадает» в контекст жизни пользователя, у него появляется причина остановиться и посмотреть.
Но здесь возникает логичный вопрос: сколько баннеров нужно, чтобы работать персонализированно хотя бы с основными сегментами? И сколько дизайнеров потребуется, чтобы эти баннеры оперативно и качественно производить?
Ответы: десятки креативов. И, если делать это вручную — слишком много времени и ресурсов.

Как выглядела задача
На входе у нас была сегментация на основе СХ персон: мы работаем с семью основными демографическими группами (молодые родители, экономные зрелые, состоятельные зрелые, взрослые с вредными привычками, состоятельная и экономная молодёжь, старший возраст).
И для каждой из них нужно создать баннер с одним и тем же товаром, но с разной подачей — так, чтобы человек увидел и подумал: «это про меня».
Мы поставили перед собой цель:
добиться визуальной и эмоциональной релевантности для каждой ЦА;
при этом не расширять команду дизайнеров и не терять в скорости.
Первые шаги и неудачи
Как и многие, мы начали с open-source инструментов. ComfyUI, SDXL, ControlNet — всё это дало интересные результаты, но на практике оказалось слишком нестабильно и требовательно к ручной настройке.
Первые генерации выглядели так:
креатив может сгенерироваться с множеством артефактов;
персонажи не всегда вписывались в сцену или вели себя неестественно;
искажался сам товар, который мы размещали в креативе.

Мы быстро поняли, что так далеко не уедем: каждая новая сцена — это 30–40 минут экспериментов, подборов prompt'а, ручной доработки.
Переход к системному решению: Phygital+
Перебрав несколько вариантов коммерческих решений, мы перешли к использованию платформы Phygital+, которая позволила нам выстроить полноценный пайплайн генерации визуалов на базе FLUX, но уже с обвязкой, необходимой для продуктивной работы:
шаблонизированные промпты, адаптируемые под нужный сегмент;
стабильные пайплайны генерации с сохранением исходного товара;
возможность совместной работы команды, включая дизайнеров и менеджеров.
Мы внедрили в генерации портрет ЦА — под каждую аудиторию мы определяли ключевые визуальные архетипы и генерировали сразу промпт.

Пример: для «взрослых с детьми до 3 лет» мы не просто показывали упаковку товара. Мы создавали сцену, где продукт появлялся на столе в светлой кухне, с игрушкой или детской посудой на фоне. Это создаёт эмоциональный якорь, который работает лучше текста.
Сложности с генерацией людей
Отдельно стоит отметить попытки сгенерировать людей, взаимодействующих с товаром. Мы хотели, чтобы на баннерах появлялись настоящие герои — женщины, держащие сок, дети за столом, мужчины на пикнике.
На практике оказалось, что такие сцены слишком капризны:
модели часто нарушают анатомию;
лица получаются неестественными или переусложнёнными;
в ряде случаев генерация отвлекала внимание от самого продукта.
Мы пришли к компромиссу: фокус на сцену и контекст, а не на человека как активного участника. Продукт находится в узнаваемом окружении, которое создаёт правильный эмоциональный отклик — но не требует сложной сценографии.
Что у нас получилось
Сегодня наш процесс создания персонализированных баннеров выглядит так:
На вход подаётся информация о товаре и ЦА.
Языковая модель готовит промпт, который учитывает контекст сцены с учётом товара и актуальных для ЦА визуальных триггеров.
Генератор создаёт баннер, сохраняя при этом изображение товара и вписывая его в сцену.
С помощью встроенных инструментов мы добавляем на креатив текстовое предложение о промо.
Дизайнер выступает как арт-директор — он выбирает креатив, а не собирает и ретуширует всё вручную из стоковых материалов.
Отдельно отмечу качество генераций в деталях вписывания продукта в окружение:

Примеры персонализации
В финале покажу несколько примеров баннеров для разных ЦА.







Сейчас мы уже видим ощутимые результаты: в три раза сократилось количество обращений к фотостокам, а сложные кейсы требуют вдвое меньше времени от дизайнера. Дальше — автоматизация и масштабирование: мы работаем над тем, чтобы генерации запускались по шаблонам, без ручного участия. Параллельно мы уточняем описания персон, чтобы креативы становились ещё точнее.
Этот проект — не про дизайн и даже не про генеративный ИИ. Он про то, как говорить с разными людьми на их языке. В ритейле это особенно важно: один и тот же товар может вызывать совершенно разные эмоции — всё зависит от контекста.
CVM даёт нам знания о клиентах. Generative AI даёт инструмент.
Персонализированные предложения становятся связующим звеном между аналитикой и ощущением «со мной говорят лично».