Банк отправляет дизайнеров на курс “по Midjourney” — а креативы не вписываются в бренд банка. Технарь-одиночка с лендингом, который «выглядит дорого, конвертит в ноль», идёт на тот же курс. Оба лечат симптом.

Дизайнеры не умеют проговорить то, что делают интуитивно: композицию, баланс, визуальную иерархию. Технари не знают, что именно спрашивать, потому что предметного знания о дизайне и аудитории нет ни у них, ни у модели.

Проведу в этой статье эксперимент над тестовым брендом несуществующего продукта, надев плащ и волшебную шляпу креативного директора и дизайнера.


«Красиво» — не атомарное свойство

Когда заказчик говорит «сделай красиво», он упаковывает в два слова десятки решений: ритм элементов на странице, контраст между акцентом и фоном, пропорции блоков, культурный контекст аудитории, иерархия внимания. Дизайнер-профессионал эти решения принимает — но интуитивно, на глаз. И когда вместо Figma ему дают Midjourney, интуиция перестаёт работать. Не потому что модель «не видит» — мудборд она примет. А потому что без вербализации результат невоспроизводим: каждый новый артефакт, формат, итерация — заново и с непредсказуемым сдвигом. Мудборд объясняет что нравится. Промпт объясняет почему — и только это масштабируется.

В дизайн-теории это давно проговорено: каждое визуальное решение раскладывается на вербализуемые принципы. Форма подобна чему-то (природе, инструменту, телу), развивается по алгоритму, посредничает между человеком и средой.

Это и есть исходник для промптов. Раньше он работал «внутри головы» дизайнера, теперь его надо экстернализировать — превратить в текст, который поймёт и человек, и модель.


Два неполных специалиста

Возьмём два типа людей, которые сегодня работают с генеративными моделями для визуальных задач. Оба неполны.

Промпт-инженер без предметной области

Дизайнер без навыка вербализации

Умеет

Структурировать запрос, итерировать, управлять параметрами

Видеть композицию, чувствовать баланс, оценивать результат

Не умеет

Определить, что именно спрашивать. Не знает, что такое «визуальная иерархия», и не может её описать

Перевести «мне не нравится» в «контраст между заголовком и фоном ниже 3:1, иерархия читается снизу вверх, а не сверху вниз»

Типичный промпт

«Создай современный минималистичный лендинг в тёмных тонах с акцентом на оранжевый»

[Молчание. Открывает Figma и делает руками.]

Результат

Статистически средний «красивый» лендинг. Выглядит дорого, но пуст

Сильный дизайн, но не масштабируется через AI

Нужна связка: человек с предметным знанием, который умеет это знание проговорить. И это не новая роль — это старая профессия (дизайнер), у которой поменялся выходной формат: не макет, а текст.


Кейс: бренд с нуля за 8 часов

кейс

Чтобы не быть голословным, я провёл эксперимент. Задача: полная дизайн-система для нового PWA — от бренд-платформы до лендинга и рекламных креативов. Контекст: приложение для автомобильных туристов, которые едут по бездорожью России, Монголии, Китая.

Степь Монголии — типовой контекст использования приложения
Степь Монголии — типовой контекст использования приложения

Кейс поставлен «против» исходного тезиса: я не дизайнер, а технарь с аналитическими навыками. Если умение проговорить решение — то, что отделяет работу от лотереи, оно не должно быть привязано к профессии. Дизайнер с ним получает рычаг; не-дизайнер с предметным знанием — рабочий результат там, где раньше нужен был арт-директор.

Два подхода.

Наивный: один промпт в Qwen — «сделай лендинг для приложения автотуристов, путешествующих по России, СНГ, Монголии и Китаю, современный, красивый». 5 минут.

Pipeline: последовательная проработка от онтологии продукта до конкретных артефактов, каждый уровень с AI, но с человеческим отсечением на каждом шаге. 8 часов.

Что здесь настоящее, а что пропущено

В реальном проекте перед созданием бренда идёт custdev: валидация идеи у потенциальных пользователей. Я его пропустил — это тестовый прогон метода, а не запуск. Идея валидируется косвенно: 10 000+ сообщество Hello Camper, ежегодная выставка с 30+ спикерами по автотуризму, чаты оверлендеров (автотуристы, которые ездят по бездорожью в автономных экспедициях на несколько недель и больше)

Зачем бренд до MVP?

для фаундеров и продактов

Дальше возникает вопрос, который задаст любой продакт: зачем стартапу-одиночке бренд? Запусти MVP, проверь гипотезу, бренд потом.

Но бренд — не логотип. Это система ограничений: как ты говоришь о продукте, показываешь его, продвигаешь. Без неё ты говоришь «со всеми» — а значит, ни с кем конкретным. Наивный лендинг ниже — идеальная иллюстрация: он обращается к «90% интернета», а не к нашим путешественникам. Выглядит дорого. Не цепляет тех, кому нужен.

Разные категории людей бессознательно воспринимают бренды по-разному — это не интуиция, а подтверждённый результат (Rodas et al., Journal of Consumer Research, 2021: парадоксальные бренды оцениваются выше людьми с опытом межкультурной мобильности — то есть ровно оверлендерами). Раньше попадание в нужную категорию было интуицией арт-директора. Pipeline — попытка сделать эту интуицию воспроизводимой техникой.

В полном цикле после бренд-платформы стоит ещё один шаг: взять все три варианта платформы, которые предложил AI, пройти pipeline по каждому, получить три набора артефактов — и пойти с ними к реальным путешественникам из аудитории. Для стартапера-одиночки «фокус-группа» — это пять знакомых из целевой аудитории. Здесь я был собственной фокус-группой.

Что получилось за 5 минут

Наивный лендинг — первый экран
Наивный лендинг — первый экран

Тёмная тема, оранжевые градиенты, AI-сгенерированное фото внедорожника в пыли. «15 000+ маршрутов, 847 локаций, 4.9★». Два CTA: «Скачать бесплатно» и «Смотреть видео». Ниже — карточки регионов с иконками, блок «Топ направлений», аватарки пользователей «+127 прошли этот маршрут».

Наивный лендинг — контент
Наивный лендинг — контент

Визуально — дорого. Покажи коллегам без контекста — выберут его.

Что получилось за 8 часов

Pipeline лендинг — первый экран
Pipeline лендинг — первый экран

Тёплый светлый фон. Фото из кабины автомобиля — пыльное стекло, степь, ощущение «я там». Одна фраза: «Не дорога — направление». Подстрочник: «Wayfinding-система для автопутешественников Евразии. Офлайн.» Один CTA: «Открыть карту». Ниже — один абзац: «Google Maps не знает, где кончается дорога. iOverlander не обновлялся годами. Бумажная карта не скажет, проходил ли кто-нибудь этот брод в этом году.»

Pipeline лендинг — фичи
Pipeline лендинг — фичи

Три фичи — каждая со скриншотом реального экрана приложения. «Отметки от тех, кто проехал», «Офлайн. Целиком.», «Территория говорит». Финал: «Перевалы Монголии. Броды Алтая. Зимники Якутии. Готов к тому, что встретится.»

Почему наивный выигрывает голосование — и проигрывает рынок

Наивный лендинг ярче — это факт. Большинство коллег в опросе выберут его, и это ожидаемо. Модель обучена на тысячах «хороших» лендингов и выдаёт статистически средний «дорогой» дизайн.

Проблема в другом.

Параметр

Наивный

Pipeline

Первое впечатление

Ярче, «дороже»

Сдержаннее, тише

«15 000+ маршрутов»

Выдуманные метрики. Продукта и пользователей ещё нет

Никаких выдуманных показателей. Данные на скриншотах — очевидный UI-мок, а не заявление о рынке

Фото

AI-генерация. Опытный путешественник видит фейк за секунду: слишком чистая машина, нереалистичный пылевой шлейф

Вид из кабины. Пыль на стекле. Узнаваемый опыт

CTA

2 на первом экране + «Скачать» в хедере. Скачивать нечего

Один: «Открыть карту»

Социальное доказательство

«+127 прошли маршрут», аватарки

Нет. Потому что нет пользователей

Соответствие аудитории

Абстрактный путешественник

Оверлендер (голос штурмана, конкретика)

Масштабируемость

Только лендинг. Системы нет

Из той же системы вышли tokens, компоненты, 5 экранов app, спецификация креативов

Стоимость переделки

Полная: следующий артефакт — новый раунд «сделай красиво»

Итерационная: принципы и tokens уже есть

Наивный лендинг — один артефакт. Pipeline-лендинг — вершина системы, где каждый элемент консистентен с остальными: бренд-платформа → принципы → visual identity → tokens → компоненты → экраны → лендинг → креативы.

Очевидное возражение: «90% посетителей не почувствуют разницы. Зачем упарываться?» Pipeline нужен не для тонких материй, а для масштабируемости. 20 артефактов по 5 минут — это 20 лотерей. 8 часов один раз — это экран, баннер, push, карточка в соцсети, выведенные из одной системы. Без системы каждый формат — отдельная генерация заново.


Как устроен pipeline: от онтологии до пикселей

метод

Уровень −1. Онтология продукта

Суть уровня в одном предложении: прежде чем спрашивать «какой логотип», надо письменно ответить на вопрос «что продукт делает с отношением человека к среде» — иначе все последующие промпты держатся на воздухе. На языке продакта: это про JTBD и позиционирование, только сформулированные так, чтобы их можно было скормить модели. На языке программиста: это корневая спецификация, от которой наследуются все нижние контракты.

Дальше — как это выглядело у меня (можно пролистать, если интересует только метод, а не конкретный кейс автотуризма).

Прежде чем «какой логотип» — ответить: что этот продукт делает с отношением человека к среде?

Пообщавшись с AI насчёт концепта нашего продукта, получаем такой промт для глубокого исследования:

Я проектирую бренд навигационного PWA для overlanders — автомобильных путешественников по бездорожью России, Монголии, Китая. Продукт — не GPS-навигатор и не туристический гид. Он превращает неизвестную территорию в проходимую, не обещая предсказуемости. Пользователь ценит неопределённость как часть опыта.
Проанализируй: какие культурные архетипы и бренд-модели работают с этой двойственностью «контроль + неизвестность»? Приведи 5 примеров брендов из разных индустрий, которые успешно занимают эту позицию. Для каждого: какую метафору отношений «человек — среда» они используют.

На выходе — 15-страничное исследование. Архетипическое сочетание Исследователь × Маг. Пять брендов-референсов (Land Rover, Bloomberg Terminal, Arc’teryx, SpaceX, Obsidian) — каждый удерживает парадокс по-своему. Культурные коды: русский «авось» как информированная готовность к непредсказуемому, монгольское «Ger Positioning System» (расспрашивание кочевников), тенгрианские овоо на перевалах. Академические рамки: антихрупкость Талеба (система выигрывает от неопределённости), лиминальность Тёрнера (состояние «между» территориями), различие wayfinding и navigation.

Эта формулировка — интуитивное понимание аудитории, переведённое в текст. Человеку нужно знание предметки, чтобы его сформулировать.

Уровень 0. Бренд-платформа

На языке дизайнера: это brand book без мудборда, только словами. На языке технаря: это набор инвариантов, которые не должен нарушать ни один артефакт ниже по pipeline.

Из исследования — три варианта платформы. AI сгенерировал, я выбрал. Дальше — стресс-тест: «Найди внутренние противоречия. Где ценности конфликтуют?»

AI нашёл три:

  1. «Готовность > предсказуемость» vs. миссия «превращаем в проходимую». «Проходимую» — это и есть форма предсказуемости. Если приложение говорит «брод 80 см, дно каменистое» — оно уже предсказало.

  2. «Способность пользователя > зависимость» vs. сам факт приложения. Любой полезный инструмент создаёт зависимость. Последовательное применение требует от продукта иногда показывать меньше.

  3. «Честность территории» vs. «спокойный голос». Спокойный тон в момент реальной опасности — не верность принципу, а дизайн-паттерн, снижающий воспринимаемый риск.

Решение двухуровневое. Три регистра голоса — calm (по умолчанию), direct (факт + неполнота + решение за вами), silent (только данные) — снимают №1 и №3: тон перестаёт быть единым, продукт перестаёт обещать спокойствие там, где его нет.

№2 (зависимость от инструмента) голосом не снимается. Здесь работает silent mode как первый класс, а не аварийный режим: приложение показывает сырые данные без интерпретаций, и это явная часть ценностного контракта.

Дальше №2 остаётся открытым и решается продуктовыми решениями — какие фичи намеренно не делать. Часть противоречий лучше оставить открытыми, а не затыкать формулировкой.

Без предметного знания противоречия невидимы, AI их сам не разрешит.

Уровень 1. Визуальная семантика

На языке программиста: это интерфейсы между бренд-платформой и конкретными визуальными решениями. На языке продакта: это правила, по которым любой новый экран можно оценить «наш / не наш» без созыва совещания.

Три принципа, переведённые из дизайн-теории в конкретные правила.

Морфология формы. Плотность интерфейса = f(территория). Район с сотней точек — визуально насыщен. Район без данных — разрежён, больше топографии, меньше UI. Пользователь считывает уровень изученности территории до того, как прочитает слово.

Модель подобия. Продукт структурно подобен своему пользователю, а не своей категории. Единица контента — не «точка на карте», а фрагмент с атрибуцией и давностью: «Брод, июль 2024, Hilux, проехал без подготовки». Не факт — чьё-то наблюдение. Путешественник взвешивает источники, как делает всегда.

Среда как со-автор. Территория — не объект отображения, а активный участник. Сезонность встроена в ядро: карта одного района выглядит по-разному в июне и ноябре, потому что данные разные.

AI развернул каждый принцип в полную спецификацию. Но принципы — мои. Они называют словами то, что путешественник «видит» (давность данных важна, сезонность критична, пустое место на карте — не баг) и что дизайнер «чувствует» (плотность UI должна отражать плотность информации).

Уровень 2. Visual Identity System

Из принципов — конкретика: шрифт Inter (гуманистический гротеск, открытые апертуры, кириллица + латиница), палитра «Сухая степь» (тёплый серый фон, янтарный акцент для действий пользователя, давность данных читается по насыщенности цвета), ромб-вейпоинт как логотип (совпадает с формой отметки на карте — айдентика вырастает из информационной архитектуры).

Каждое решение трассируется к принципу. Каждое — с антипримером: почему НЕ тёмная тема (конфликтует с тайловой картой), почему НЕ красный для опасности (это голос Героя, не наш), почему НЕ декоративные иконки (иконки территории — из картографических условных знаков, которые путешественник уже знает).

Уровень 3. Артефакты

Последовательность промптов для кодогенерации: tokens → иконки → 3 компонента → 4 экрана → лендинг → спецификация креативов. Каждый промпт ссылается на выход предыдущего и на документы бренд-платформы. Ни один не содержит слова «красиво». Каждый содержит 10–20 конкретных ограничений.

Экраны приложения: карта, карточка точки, офлайн-состояние
Экраны приложения: карта, карточка точки, офлайн-состояние
Карточка точки с атрибуцией и давностью данных
Карточка точки с атрибуцией и давностью данных
Офлайн-состояние с фактическим empty state
Офлайн-состояние с фактическим empty state

Момент, когда AI убедительно ошибся

для всех, кто делает ставку на «главное — научиться промптить»

В середине pipeline AI запретил показывать лица людей на фотографиях. Обоснование: «Принцип “Среда как со-автор” → территория — субъект кадра, человек — нет. Принцип “Модель подобия” → камера = глаза водителя → от первого лица → лиц нет.»

Я принял это и пошёл дальше. А потом вернулся.

Исследование на Уровне −1 прямо говорило: коммунитас (товарищество и солидарность путешественников), «Ger Positioning System (GPS)» (так монголы в шутку называют расспрашивание встречных кочевников), данные создаются людьми, доверие к данным = доверие к источнику. «От тех, кто проехал» — это люди с лицами.

Я указал на это и попросил скорректировать.

Новая формулировка: люди допустимы, когда они — источник данных или часть процесса ориентирования. Человек указывает направление. Лицо освещено экраном в кабине ночью. Группа обсуждает брод у машины. Кочевник показывает дорогу. Если убрать человека из кадра и смысл фото не изменился — человек был декорацией, а не субъектом.

Группа обсуждает брод у машины
Группа обсуждает брод у машины
Кочевник указывает дорогу
Кочевник указывает дорогу
Лицо, освещённое экраном в кабине ночью
Лицо, освещённое экраном в кабине ночью

Pipeline ошибку не поймал. Поймало предметное знание — то самое, которое на Уровне −1 дало формулировку про коммунитас и «Ger Positioning System». Если бы я не знал, что данные у этих путешественников неотделимы от источника, я бы принял запрет на лица и пошёл дальше.

Что pipeline сделал: зафиксировал обоснование AI рядом с принципами. Ошибка стала перечитываемой — без этого «без лиц» осталось бы молчаливым предпочтением, въевшимся в следующие генерации.

Поэтому точнее: pipeline не заменяет предметное знание и не ловит ошибки сам — он обеспечивает консистентность и делает решения оспариваемыми. Ловля ошибок — работа человека, который знает, для кого делает продукт. Никакой CoT, few-shot или structured output эту дыру не закрывает: ошибка была не в форме запроса, а в том, что у AI не было способа узнать, что у этой аудитории данные неотделимы от источника. Промпт-инженерия — множитель; если множить не на что, множитель ничего не создаёт.

Ну а при наивном промтинге мы бы даже не попали в эту проблему, без шансов зацепить тех пользователей, кому это важно.


Маркетинг на нулевом этапе: когда нет контента и пользователей

Наивный лендинг решает проблему пустоты просто: выдумывает. «15 000+ маршрутов» — при нулевой базе. «+127 прошли» — при нулевом сообществе. Это работает для продукта, чей бренд построен на обещании масштаба. Но если бренд-платформа говорит «честность территории > красивая картинка» — первая же ложь на странице уничтожает позиционирование.

Из бренд-платформы (голос штурмана, утилитарность, сообщество) вытекает другая стратегия.

Контент вместо социального доказательства. Пока пользователей нет — есть экспертиза. Один пост в профильном чате с реальной картой перевалов даёт больше доверия, чем десять выдуманных отзывов.

Утилитарность вместо промо. Лендинг — не «продающая страница», а точка входа в инструмент. CTA один: «Открыть карту». Ценность видна за 5 секунд или нет.

Экран без данных — без выдумки. «Сейчас 47 точек в Монголии. Добавь свою.» — сильнее, чем «тысячи маршрутов». Потому что 47 мы заполним вручную при старте продукта, а «тысячи» — ложь. И путешественник это чувствует.

Сначала сообщество. Первые пользователи придут не с лендинга, а из чатов и форумов — по ссылке от знакомого. Лендинг для них — подтверждение серьёзности, не конверсионная воронка.

Генеративная модель без бренд-платформы работает как шаблон — только усреднённый по обучающей выборке, а не взятый с Dribbble. Пока я писал эту статью, коллега прогнал ту же задачу через другую нейросеть и получил лендинг, неотличимый от моего «наивного»: тот же тёмный фон, те же выдуманные показатели, те же безликие карточки. Это форма, к которой сходится любая генерация без ограничений сверху — и неважно, шаблон это с Webflow или генерация в Qwen.


Аналогия, которую узнают обе профессии: constraint-driven production

Программисты узнают паттерн: сначала OpenAPI spec, потом codegen. Дизайнеры узнают другой тот же паттерн: сначала design brief, потом макеты. Обе профессии давно знают, что спецификация дороже исполнения — и что без неё исполнение не масштабируется. Новое только одно: теперь исполнитель — модель, и она требует, чтобы brief был текстом, а не мудбордом.

Никто не пишет «сделай API красиво» — пишут endpoints, типы данных, коды ошибок. Никто не пишет грамотному подрядчику «сделай лендинг красиво» — дают brief: аудитория, тональность, иерархия, ограничения. Спецификация — это вербализация того, что профессионал «видит» в голове.

Pipeline для дизайна — похожая идея, с одной оговоркой. В софте спецификация проверяема: есть input/output, есть тест, который либо проходит, либо нет. В дизайне верхние уровни (архетип, культурный код, «голос бренда») — не спецификация, а гипотеза. Она проверяется рынком, а не тестом. Нижние уровни (tokens, типографика, spacing, правила для CTA) — уже ближе к контракту.

Поэтому точнее не «spec-driven development для бренда», а constraint-driven production: система ограничений, которая снижает вариативность и держит консистентность. Бренд-платформа = архитектурное решение. Принципы = ограничения. Visual Identity Brief = спецификация нижних уровней. Tokens = типы данных. Компоненты = модули. Лендинг = собранное приложение.

И так же, как в программировании, спецификация стоит дороже кодогенерации — но без неё каждый следующий артефакт генерируется с нуля.


Что делать

Не «курс по Midjourney». Дальше — два списка для двух разных ситуаций.

Если вы руководите дизайн-командой

для руководителей

Научить дизайнеров проговаривать решения. Не промпты — профессиональное мышление. «Почему ты выбрал этот контраст?» «Какую иерархию внимания закладываешь?» «Как это связано с контекстом использования?» Это полезно и без AI — для ТЗ, ревью, коммуникации с заказчиком. С AI — становится критичным.

Дать шаблон design brief с проговорёнными критериями. Не mood board (интуиция без текста), а структурированный документ: контекст использования, визуальная иерархия, тональность, референсы с разбором (что берём / что нет и почему), ограничения, метрики «хорошо».

Включить промпт-ревью в процесс. Как code review. Не «красивый ли результат?», а «трассируется ли каждое решение к принципу, или промпт держится на общих словах?»

Чеклист для самопроверки. Можешь ли ты объяснить каждое визуальное решение одним предложением? Если нет — оно случайное. Случайное решение с AI — лотерея. Проговорённое — спецификация.

Если вы делаете продукт один и без дизайнера

для технарей-одиночек и фаундеров

Начните не с Figma и не с Midjourney, а с текстового документа на одну страницу. Архетип, три принципа, три антипримера («почему НЕ тёмная тема», «почему НЕ красный для опасности»). Это ваш constraint-файл — его вы будете прикладывать к каждому промпту ниже.

Сохраняйте обоснования AI рядом с принципами. Когда модель говорит «поэтому не показываем лиц» — записывайте это в тот же документ. Ошибки становятся перечитываемыми: через неделю вы заметите, что принцип был натянут.

Правило проверки промпта. Если промпт не ссылается хотя бы на один пункт из вашего constraint-файла — это «сделай красиво» в переодетом виде. Переписывайте.

Не нанимайте арт-директора, чтобы закрыть этот зазор. Нанимайте час консультации у человека из вашей целевой аудитории — чтобы проверить формулировки Уровня −1. Остальное достраивается pipeline.


Вместо заключения

Вернёмся к банку из начала. Дизайнеры генерят неподходящие креативы не потому, что не умеют пользоваться Midjourney. А потому, что их профессиональное знание — композиция, баланс, иерархия внимания, культурный контекст — пока существует как интуиция, а не как текст.

AI повышает ценность тех, кто умеет превращать эстетическое суждение в систему ограничений. Неважно, откуда это умение — из академии дизайна, из опыта работы с продуктом или из собственной аналитики. Важно, что его теперь нужно экстернализировать: превратить в текст, который поймёт и человек, и модель.


Об авторе. Андрей Ерёменок — CTO, 20+ лет в разработке. Пишу о пересечении AI и инженерных практик. Предыдущие статьи на Хабре. Telegram: Пикник Айтишника.

Комментарии (0)