Банк отправляет дизайнеров на курс “по Midjourney” — а креативы не вписываются в бренд банка. Технарь-одиночка с лендингом, который «выглядит дорого, конвертит в ноль», идёт на тот же курс. Оба лечат симптом.
Дизайнеры не умеют проговорить то, что делают интуитивно: композицию, баланс, визуальную иерархию. Технари не знают, что именно спрашивать, потому что предметного знания о дизайне и аудитории нет ни у них, ни у модели.
Проведу в этой статье эксперимент над тестовым брендом несуществующего продукта, надев плащ и волшебную шляпу креативного директора и дизайнера.
«Красиво» — не атомарное свойство
Когда заказчик говорит «сделай красиво», он упаковывает в два слова десятки решений: ритм элементов на странице, контраст между акцентом и фоном, пропорции блоков, культурный контекст аудитории, иерархия внимания. Дизайнер-профессионал эти решения принимает — но интуитивно, на глаз. И когда вместо Figma ему дают Midjourney, интуиция перестаёт работать. Не потому что модель «не видит» — мудборд она примет. А потому что без вербализации результат невоспроизводим: каждый новый артефакт, формат, итерация — заново и с непредсказуемым сдвигом. Мудборд объясняет что нравится. Промпт объясняет почему — и только это масштабируется.
В дизайн-теории это давно проговорено: каждое визуальное решение раскладывается на вербализуемые принципы. Форма подобна чему-то (природе, инструменту, телу), развивается по алгоритму, посредничает между человеком и средой.
Это и есть исходник для промптов. Раньше он работал «внутри головы» дизайнера, теперь его надо экстернализировать — превратить в текст, который поймёт и человек, и модель.
Два неполных специалиста
Возьмём два типа людей, которые сегодня работают с генеративными моделями для визуальных задач. Оба неполны.
Промпт-инженер без предметной области |
Дизайнер без навыка вербализации |
|
|---|---|---|
Умеет |
Структурировать запрос, итерировать, управлять параметрами |
Видеть композицию, чувствовать баланс, оценивать результат |
Не умеет |
Определить, что именно спрашивать. Не знает, что такое «визуальная иерархия», и не может её описать |
Перевести «мне не нравится» в «контраст между заголовком и фоном ниже 3:1, иерархия читается снизу вверх, а не сверху вниз» |
Типичный промпт |
«Создай современный минималистичный лендинг в тёмных тонах с акцентом на оранжевый» |
[Молчание. Открывает Figma и делает руками.] |
Результат |
Статистически средний «красивый» лендинг. Выглядит дорого, но пуст |
Сильный дизайн, но не масштабируется через AI |
Нужна связка: человек с предметным знанием, который умеет это знание проговорить. И это не новая роль — это старая профессия (дизайнер), у которой поменялся выходной формат: не макет, а текст.
Кейс: бренд с нуля за 8 часов
кейс
Чтобы не быть голословным, я провёл эксперимент. Задача: полная дизайн-система для нового PWA — от бренд-платформы до лендинга и рекламных креативов. Контекст: приложение для автомобильных туристов, которые едут по бездорожью России, Монголии, Китая.

Кейс поставлен «против» исходного тезиса: я не дизайнер, а технарь с аналитическими навыками. Если умение проговорить решение — то, что отделяет работу от лотереи, оно не должно быть привязано к профессии. Дизайнер с ним получает рычаг; не-дизайнер с предметным знанием — рабочий результат там, где раньше нужен был арт-директор.
Два подхода.
Наивный: один промпт в Qwen — «сделай лендинг для приложения автотуристов, путешествующих по России, СНГ, Монголии и Китаю, современный, красивый». 5 минут.
Pipeline: последовательная проработка от онтологии продукта до конкретных артефактов, каждый уровень с AI, но с человеческим отсечением на каждом шаге. 8 часов.
Что здесь настоящее, а что пропущено
В реальном проекте перед созданием бренда идёт custdev: валидация идеи у потенциальных пользователей. Я его пропустил — это тестовый прогон метода, а не запуск. Идея валидируется косвенно: 10 000+ сообщество Hello Camper, ежегодная выставка с 30+ спикерами по автотуризму, чаты оверлендеров (автотуристы, которые ездят по бездорожью в автономных экспедициях на несколько недель и больше)
Зачем бренд до MVP?
для фаундеров и продактов
Дальше возникает вопрос, который задаст любой продакт: зачем стартапу-одиночке бренд? Запусти MVP, проверь гипотезу, бренд потом.
Но бренд — не логотип. Это система ограничений: как ты говоришь о продукте, показываешь его, продвигаешь. Без неё ты говоришь «со всеми» — а значит, ни с кем конкретным. Наивный лендинг ниже — идеальная иллюстрация: он обращается к «90% интернета», а не к нашим путешественникам. Выглядит дорого. Не цепляет тех, кому нужен.
Разные категории людей бессознательно воспринимают бренды по-разному — это не интуиция, а подтверждённый результат (Rodas et al., Journal of Consumer Research, 2021: парадоксальные бренды оцениваются выше людьми с опытом межкультурной мобильности — то есть ровно оверлендерами). Раньше попадание в нужную категорию было интуицией арт-директора. Pipeline — попытка сделать эту интуицию воспроизводимой техникой.
В полном цикле после бренд-платформы стоит ещё один шаг: взять все три варианта платформы, которые предложил AI, пройти pipeline по каждому, получить три набора артефактов — и пойти с ними к реальным путешественникам из аудитории. Для стартапера-одиночки «фокус-группа» — это пять знакомых из целевой аудитории. Здесь я был собственной фокус-группой.
Что получилось за 5 минут

Тёмная тема, оранжевые градиенты, AI-сгенерированное фото внедорожника в пыли. «15 000+ маршрутов, 847 локаций, 4.9★». Два CTA: «Скачать бесплатно» и «Смотреть видео». Ниже — карточки регионов с иконками, блок «Топ направлений», аватарки пользователей «+127 прошли этот маршрут».

Визуально — дорого. Покажи коллегам без контекста — выберут его.
Что получилось за 8 часов

Тёплый светлый фон. Фото из кабины автомобиля — пыльное стекло, степь, ощущение «я там». Одна фраза: «Не дорога — направление». Подстрочник: «Wayfinding-система для автопутешественников Евразии. Офлайн.» Один CTA: «Открыть карту». Ниже — один абзац: «Google Maps не знает, где кончается дорога. iOverlander не обновлялся годами. Бумажная карта не скажет, проходил ли кто-нибудь этот брод в этом году.»

Три фичи — каждая со скриншотом реального экрана приложения. «Отметки от тех, кто проехал», «Офлайн. Целиком.», «Территория говорит». Финал: «Перевалы Монголии. Броды Алтая. Зимники Якутии. Готов к тому, что встретится.»
Почему наивный выигрывает голосование — и проигрывает рынок
Наивный лендинг ярче — это факт. Большинство коллег в опросе выберут его, и это ожидаемо. Модель обучена на тысячах «хороших» лендингов и выдаёт статистически средний «дорогой» дизайн.
Проблема в другом.
Параметр |
Наивный |
Pipeline |
|---|---|---|
Первое впечатление |
Ярче, «дороже» |
Сдержаннее, тише |
«15 000+ маршрутов» |
Выдуманные метрики. Продукта и пользователей ещё нет |
Никаких выдуманных показателей. Данные на скриншотах — очевидный UI-мок, а не заявление о рынке |
Фото |
AI-генерация. Опытный путешественник видит фейк за секунду: слишком чистая машина, нереалистичный пылевой шлейф |
Вид из кабины. Пыль на стекле. Узнаваемый опыт |
CTA |
2 на первом экране + «Скачать» в хедере. Скачивать нечего |
Один: «Открыть карту» |
Социальное доказательство |
«+127 прошли маршрут», аватарки |
Нет. Потому что нет пользователей |
Соответствие аудитории |
Абстрактный путешественник |
Оверлендер (голос штурмана, конкретика) |
Масштабируемость |
Только лендинг. Системы нет |
Из той же системы вышли tokens, компоненты, 5 экранов app, спецификация креативов |
Стоимость переделки |
Полная: следующий артефакт — новый раунд «сделай красиво» |
Итерационная: принципы и tokens уже есть |
Наивный лендинг — один артефакт. Pipeline-лендинг — вершина системы, где каждый элемент консистентен с остальными: бренд-платформа → принципы → visual identity → tokens → компоненты → экраны → лендинг → креативы.
Очевидное возражение: «90% посетителей не почувствуют разницы. Зачем упарываться?» Pipeline нужен не для тонких материй, а для масштабируемости. 20 артефактов по 5 минут — это 20 лотерей. 8 часов один раз — это экран, баннер, push, карточка в соцсети, выведенные из одной системы. Без системы каждый формат — отдельная генерация заново.
Как устроен pipeline: от онтологии до пикселей
метод
Уровень −1. Онтология продукта
Суть уровня в одном предложении: прежде чем спрашивать «какой логотип», надо письменно ответить на вопрос «что продукт делает с отношением человека к среде» — иначе все последующие промпты держатся на воздухе. На языке продакта: это про JTBD и позиционирование, только сформулированные так, чтобы их можно было скормить модели. На языке программиста: это корневая спецификация, от которой наследуются все нижние контракты.
Дальше — как это выглядело у меня (можно пролистать, если интересует только метод, а не конкретный кейс автотуризма).
Прежде чем «какой логотип» — ответить: что этот продукт делает с отношением человека к среде?
Пообщавшись с AI насчёт концепта нашего продукта, получаем такой промт для глубокого исследования:
Я проектирую бренд навигационного PWA для overlanders — автомобильных путешественников по бездорожью России, Монголии, Китая. Продукт — не GPS-навигатор и не туристический гид. Он превращает неизвестную территорию в проходимую, не обещая предсказуемости. Пользователь ценит неопределённость как часть опыта. Проанализируй: какие культурные архетипы и бренд-модели работают с этой двойственностью «контроль + неизвестность»? Приведи 5 примеров брендов из разных индустрий, которые успешно занимают эту позицию. Для каждого: какую метафору отношений «человек — среда» они используют.
На выходе — 15-страничное исследование. Архетипическое сочетание Исследователь × Маг. Пять брендов-референсов (Land Rover, Bloomberg Terminal, Arc’teryx, SpaceX, Obsidian) — каждый удерживает парадокс по-своему. Культурные коды: русский «авось» как информированная готовность к непредсказуемому, монгольское «Ger Positioning System» (расспрашивание кочевников), тенгрианские овоо на перевалах. Академические рамки: антихрупкость Талеба (система выигрывает от неопределённости), лиминальность Тёрнера (состояние «между» территориями), различие wayfinding и navigation.
Эта формулировка — интуитивное понимание аудитории, переведённое в текст. Человеку нужно знание предметки, чтобы его сформулировать.
Уровень 0. Бренд-платформа
На языке дизайнера: это brand book без мудборда, только словами. На языке технаря: это набор инвариантов, которые не должен нарушать ни один артефакт ниже по pipeline.
Из исследования — три варианта платформы. AI сгенерировал, я выбрал. Дальше — стресс-тест: «Найди внутренние противоречия. Где ценности конфликтуют?»
AI нашёл три:
«Готовность > предсказуемость» vs. миссия «превращаем в проходимую». «Проходимую» — это и есть форма предсказуемости. Если приложение говорит «брод 80 см, дно каменистое» — оно уже предсказало.
«Способность пользователя > зависимость» vs. сам факт приложения. Любой полезный инструмент создаёт зависимость. Последовательное применение требует от продукта иногда показывать меньше.
«Честность территории» vs. «спокойный голос». Спокойный тон в момент реальной опасности — не верность принципу, а дизайн-паттерн, снижающий воспринимаемый риск.
Решение двухуровневое. Три регистра голоса — calm (по умолчанию), direct (факт + неполнота + решение за вами), silent (только данные) — снимают №1 и №3: тон перестаёт быть единым, продукт перестаёт обещать спокойствие там, где его нет.
№2 (зависимость от инструмента) голосом не снимается. Здесь работает silent mode как первый класс, а не аварийный режим: приложение показывает сырые данные без интерпретаций, и это явная часть ценностного контракта.
Дальше №2 остаётся открытым и решается продуктовыми решениями — какие фичи намеренно не делать. Часть противоречий лучше оставить открытыми, а не затыкать формулировкой.
Без предметного знания противоречия невидимы, AI их сам не разрешит.
Уровень 1. Визуальная семантика
На языке программиста: это интерфейсы между бренд-платформой и конкретными визуальными решениями. На языке продакта: это правила, по которым любой новый экран можно оценить «наш / не наш» без созыва совещания.
Три принципа, переведённые из дизайн-теории в конкретные правила.
Морфология формы. Плотность интерфейса = f(территория). Район с сотней точек — визуально насыщен. Район без данных — разрежён, больше топографии, меньше UI. Пользователь считывает уровень изученности территории до того, как прочитает слово.
Модель подобия. Продукт структурно подобен своему пользователю, а не своей категории. Единица контента — не «точка на карте», а фрагмент с атрибуцией и давностью: «Брод, июль 2024, Hilux, проехал без подготовки». Не факт — чьё-то наблюдение. Путешественник взвешивает источники, как делает всегда.
Среда как со-автор. Территория — не объект отображения, а активный участник. Сезонность встроена в ядро: карта одного района выглядит по-разному в июне и ноябре, потому что данные разные.
AI развернул каждый принцип в полную спецификацию. Но принципы — мои. Они называют словами то, что путешественник «видит» (давность данных важна, сезонность критична, пустое место на карте — не баг) и что дизайнер «чувствует» (плотность UI должна отражать плотность информации).
Уровень 2. Visual Identity System
Из принципов — конкретика: шрифт Inter (гуманистический гротеск, открытые апертуры, кириллица + латиница), палитра «Сухая степь» (тёплый серый фон, янтарный акцент для действий пользователя, давность данных читается по насыщенности цвета), ромб-вейпоинт как логотип (совпадает с формой отметки на карте — айдентика вырастает из информационной архитектуры).
Каждое решение трассируется к принципу. Каждое — с антипримером: почему НЕ тёмная тема (конфликтует с тайловой картой), почему НЕ красный для опасности (это голос Героя, не наш), почему НЕ декоративные иконки (иконки территории — из картографических условных знаков, которые путешественник уже знает).
Уровень 3. Артефакты
Последовательность промптов для кодогенерации: tokens → иконки → 3 компонента → 4 экрана → лендинг → спецификация креативов. Каждый промпт ссылается на выход предыдущего и на документы бренд-платформы. Ни один не содержит слова «красиво». Каждый содержит 10–20 конкретных ограничений.



Момент, когда AI убедительно ошибся
для всех, кто делает ставку на «главное — научиться промптить»
В середине pipeline AI запретил показывать лица людей на фотографиях. Обоснование: «Принцип “Среда как со-автор” → территория — субъект кадра, человек — нет. Принцип “Модель подобия” → камера = глаза водителя → от первого лица → лиц нет.»
Я принял это и пошёл дальше. А потом вернулся.
Исследование на Уровне −1 прямо говорило: коммунитас (товарищество и солидарность путешественников), «Ger Positioning System (GPS)» (так монголы в шутку называют расспрашивание встречных кочевников), данные создаются людьми, доверие к данным = доверие к источнику. «От тех, кто проехал» — это люди с лицами.
Я указал на это и попросил скорректировать.
Новая формулировка: люди допустимы, когда они — источник данных или часть процесса ориентирования. Человек указывает направление. Лицо освещено экраном в кабине ночью. Группа обсуждает брод у машины. Кочевник показывает дорогу. Если убрать человека из кадра и смысл фото не изменился — человек был декорацией, а не субъектом.



Pipeline ошибку не поймал. Поймало предметное знание — то самое, которое на Уровне −1 дало формулировку про коммунитас и «Ger Positioning System». Если бы я не знал, что данные у этих путешественников неотделимы от источника, я бы принял запрет на лица и пошёл дальше.
Что pipeline сделал: зафиксировал обоснование AI рядом с принципами. Ошибка стала перечитываемой — без этого «без лиц» осталось бы молчаливым предпочтением, въевшимся в следующие генерации.
Поэтому точнее: pipeline не заменяет предметное знание и не ловит ошибки сам — он обеспечивает консистентность и делает решения оспариваемыми. Ловля ошибок — работа человека, который знает, для кого делает продукт. Никакой CoT, few-shot или structured output эту дыру не закрывает: ошибка была не в форме запроса, а в том, что у AI не было способа узнать, что у этой аудитории данные неотделимы от источника. Промпт-инженерия — множитель; если множить не на что, множитель ничего не создаёт.
Ну а при наивном промтинге мы бы даже не попали в эту проблему, без шансов зацепить тех пользователей, кому это важно.
Маркетинг на нулевом этапе: когда нет контента и пользователей
Наивный лендинг решает проблему пустоты просто: выдумывает. «15 000+ маршрутов» — при нулевой базе. «+127 прошли» — при нулевом сообществе. Это работает для продукта, чей бренд построен на обещании масштаба. Но если бренд-платформа говорит «честность территории > красивая картинка» — первая же ложь на странице уничтожает позиционирование.
Из бренд-платформы (голос штурмана, утилитарность, сообщество) вытекает другая стратегия.
Контент вместо социального доказательства. Пока пользователей нет — есть экспертиза. Один пост в профильном чате с реальной картой перевалов даёт больше доверия, чем десять выдуманных отзывов.
Утилитарность вместо промо. Лендинг — не «продающая страница», а точка входа в инструмент. CTA один: «Открыть карту». Ценность видна за 5 секунд или нет.
Экран без данных — без выдумки. «Сейчас 47 точек в Монголии. Добавь свою.» — сильнее, чем «тысячи маршрутов». Потому что 47 мы заполним вручную при старте продукта, а «тысячи» — ложь. И путешественник это чувствует.
Сначала сообщество. Первые пользователи придут не с лендинга, а из чатов и форумов — по ссылке от знакомого. Лендинг для них — подтверждение серьёзности, не конверсионная воронка.
Генеративная модель без бренд-платформы работает как шаблон — только усреднённый по обучающей выборке, а не взятый с Dribbble. Пока я писал эту статью, коллега прогнал ту же задачу через другую нейросеть и получил лендинг, неотличимый от моего «наивного»: тот же тёмный фон, те же выдуманные показатели, те же безликие карточки. Это форма, к которой сходится любая генерация без ограничений сверху — и неважно, шаблон это с Webflow или генерация в Qwen.
Аналогия, которую узнают обе профессии: constraint-driven production
Программисты узнают паттерн: сначала OpenAPI spec, потом codegen. Дизайнеры узнают другой тот же паттерн: сначала design brief, потом макеты. Обе профессии давно знают, что спецификация дороже исполнения — и что без неё исполнение не масштабируется. Новое только одно: теперь исполнитель — модель, и она требует, чтобы brief был текстом, а не мудбордом.
Никто не пишет «сделай API красиво» — пишут endpoints, типы данных, коды ошибок. Никто не пишет грамотному подрядчику «сделай лендинг красиво» — дают brief: аудитория, тональность, иерархия, ограничения. Спецификация — это вербализация того, что профессионал «видит» в голове.
Pipeline для дизайна — похожая идея, с одной оговоркой. В софте спецификация проверяема: есть input/output, есть тест, который либо проходит, либо нет. В дизайне верхние уровни (архетип, культурный код, «голос бренда») — не спецификация, а гипотеза. Она проверяется рынком, а не тестом. Нижние уровни (tokens, типографика, spacing, правила для CTA) — уже ближе к контракту.
Поэтому точнее не «spec-driven development для бренда», а constraint-driven production: система ограничений, которая снижает вариативность и держит консистентность. Бренд-платформа = архитектурное решение. Принципы = ограничения. Visual Identity Brief = спецификация нижних уровней. Tokens = типы данных. Компоненты = модули. Лендинг = собранное приложение.
И так же, как в программировании, спецификация стоит дороже кодогенерации — но без неё каждый следующий артефакт генерируется с нуля.
Что делать
Не «курс по Midjourney». Дальше — два списка для двух разных ситуаций.
Если вы руководите дизайн-командой
для руководителей
Научить дизайнеров проговаривать решения. Не промпты — профессиональное мышление. «Почему ты выбрал этот контраст?» «Какую иерархию внимания закладываешь?» «Как это связано с контекстом использования?» Это полезно и без AI — для ТЗ, ревью, коммуникации с заказчиком. С AI — становится критичным.
Дать шаблон design brief с проговорёнными критериями. Не mood board (интуиция без текста), а структурированный документ: контекст использования, визуальная иерархия, тональность, референсы с разбором (что берём / что нет и почему), ограничения, метрики «хорошо».
Включить промпт-ревью в процесс. Как code review. Не «красивый ли результат?», а «трассируется ли каждое решение к принципу, или промпт держится на общих словах?»
Чеклист для самопроверки. Можешь ли ты объяснить каждое визуальное решение одним предложением? Если нет — оно случайное. Случайное решение с AI — лотерея. Проговорённое — спецификация.
Если вы делаете продукт один и без дизайнера
для технарей-одиночек и фаундеров
Начните не с Figma и не с Midjourney, а с текстового документа на одну страницу. Архетип, три принципа, три антипримера («почему НЕ тёмная тема», «почему НЕ красный для опасности»). Это ваш constraint-файл — его вы будете прикладывать к каждому промпту ниже.
Сохраняйте обоснования AI рядом с принципами. Когда модель говорит «поэтому не показываем лиц» — записывайте это в тот же документ. Ошибки становятся перечитываемыми: через неделю вы заметите, что принцип был натянут.
Правило проверки промпта. Если промпт не ссылается хотя бы на один пункт из вашего constraint-файла — это «сделай красиво» в переодетом виде. Переписывайте.
Не нанимайте арт-директора, чтобы закрыть этот зазор. Нанимайте час консультации у человека из вашей целевой аудитории — чтобы проверить формулировки Уровня −1. Остальное достраивается pipeline.
Вместо заключения
Вернёмся к банку из начала. Дизайнеры генерят неподходящие креативы не потому, что не умеют пользоваться Midjourney. А потому, что их профессиональное знание — композиция, баланс, иерархия внимания, культурный контекст — пока существует как интуиция, а не как текст.
AI повышает ценность тех, кто умеет превращать эстетическое суждение в систему ограничений. Неважно, откуда это умение — из академии дизайна, из опыта работы с продуктом или из собственной аналитики. Важно, что его теперь нужно экстернализировать: превратить в текст, который поймёт и человек, и модель.
Об авторе. Андрей Ерёменок — CTO, 20+ лет в разработке. Пишу о пересечении AI и инженерных практик. Предыдущие статьи на Хабре. Telegram: Пикник Айтишника.