Привет, Хабр!

Я – Михаил Суворов, технический менеджер продуктов искусственного интеллекта X5 Tech.
В статье я расскажу про наш кейс создания персонализированных баннеров с помощью ИИ.

Персонализация — не тренд, а необходимость

Мы начали с очевидного: универсальные баннеры больше не работают. Люди привыкают к однотипной рекламе и перестают её замечать. А вот персонализированные предложения — те, которые выглядят уместно и говорят на языке конкретного человека — всё ещё привлекают внимание. Когда баннер «попадает» в контекст жизни пользователя, у него появляется причина остановиться и посмотреть.

Но здесь возникает логичный вопрос: сколько баннеров нужно, чтобы работать персонализированно хотя бы с основными сегментами? И сколько дизайнеров потребуется, чтобы эти баннеры оперативно и качественно производить?

Ответы: десятки креативов. И, если делать это вручную — слишком много времени и ресурсов.

Как выглядела задача

На входе у нас была сегментация на основе СХ персон: мы работаем с семью основными демографическими группами (молодые родители, экономные зрелые, состоятельные зрелые, взрослые с вредными привычками, состоятельная и экономная молодёжь, старший возраст).

И для каждой из них нужно создать баннер с одним и тем же товаром, но с разной подачей — так, чтобы человек увидел и подумал: «это про меня».

Мы поставили перед собой цель:

  • добиться визуальной и эмоциональной релевантности для каждой ЦА;

  • при этом не расширять команду дизайнеров и не терять в скорости.

Первые шаги и неудачи

Как и многие, мы начали с open-source инструментов. ComfyUI, SDXL, ControlNet — всё это дало интересные результаты, но на практике оказалось слишком нестабильно и требовательно к ручной настройке.

Первые генерации выглядели так:

  • креатив может сгенерироваться с множеством артефактов;

  • персонажи не всегда вписывались в сцену или вели себя неестественно;

  • искажался сам товар, который мы размещали в креативе.

Мы быстро поняли, что так далеко не уедем: каждая новая сцена — это 30–40 минут экспериментов, подборов prompt'а, ручной доработки.

Переход к системному решению: Phygital+

Перебрав несколько вариантов коммерческих решений, мы перешли к использованию платформы Phygital+, которая позволила нам выстроить полноценный пайплайн генерации визуалов на базе FLUX, но уже с обвязкой, необходимой для продуктивной работы:

  • шаблонизированные промпты, адаптируемые под нужный сегмент;

  • стабильные пайплайны генерации с сохранением исходного товара;

  • возможность совместной работы команды, включая дизайнеров и менеджеров.

Мы внедрили в генерации портрет ЦА — под каждую аудиторию мы определяли ключевые визуальные архетипы и генерировали сразу промпт.

Пример: для «взрослых с детьми до 3 лет» мы не просто показывали упаковку товара. Мы создавали сцену, где продукт появлялся на столе в светлой кухне, с игрушкой или детской посудой на фоне. Это создаёт эмоциональный якорь, который работает лучше текста.

Сложности с генерацией людей

Отдельно стоит отметить попытки сгенерировать людей, взаимодействующих с товаром. Мы хотели, чтобы на баннерах появлялись настоящие герои — женщины, держащие сок, дети за столом, мужчины на пикнике.

На практике оказалось, что такие сцены слишком капризны:

  • модели часто нарушают анатомию;

  • лица получаются неестественными или переусложнёнными;

  • в ряде случаев генерация отвлекала внимание от самого продукта.

Мы пришли к компромиссу: фокус на сцену и контекст, а не на человека как активного участника. Продукт находится в узнаваемом окружении, которое создаёт правильный эмоциональный отклик — но не требует сложной сценографии.

Что у нас получилось

Сегодня наш процесс создания персонализированных баннеров выглядит так:

  1. На вход подаётся информация о товаре и ЦА.

  2. Языковая модель готовит промпт, который учитывает контекст сцены с учётом товара и актуальных для ЦА визуальных триггеров.

  3. Генератор создаёт баннер, сохраняя при этом изображение товара и вписывая его в сцену.

  4. С помощью встроенных инструментов мы добавляем на креатив текстовое предложение о промо.

  5. Дизайнер выступает как арт-директор — он выбирает креатив, а не собирает и ретуширует всё вручную из стоковых материалов.

Отдельно отмечу качество генераций в деталях вписывания продукта в окружение:

Примеры персонализации

В финале покажу несколько примеров баннеров для разных ЦА.

Сейчас мы уже видим ощутимые результаты: в три раза сократилось количество обращений к фотостокам, а сложные кейсы требуют вдвое меньше времени от дизайнера. Дальше — автоматизация и масштабирование: мы работаем над тем, чтобы генерации запускались по шаблонам, без ручного участия. Параллельно мы уточняем описания персон, чтобы креативы становились ещё точнее.

Этот проект — не про дизайн и даже не про генеративный ИИ. Он про то, как говорить с разными людьми на их языке. В ритейле это особенно важно: один и тот же товар может вызывать совершенно разные эмоции — всё зависит от контекста.

CVM даёт нам знания о клиентах. Generative AI даёт инструмент.
Персонализированные предложения становятся связующим звеном между аналитикой и ощущением «со мной говорят лично».

Комментарии (0)