Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента / forpes.ru

Главная
Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента

Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента +7

16.04.2026 15:39

Neyroskuf 19 11000 Источник

И вот тут довольно сложно в двух словах объяснить, в чем, собственно, преимущество MJ над другими генераторами изображений. И есть ли оно вообще. А все потому, что если оценка какой-то определенной части сущности креатива уходит от измеряемых метрик в сторону вкусовщины - то это уже необъективная метрика. Вкусы у всех разные. А еще о них не спорят. Поэтому если руководство ниже поможет хоть кому-то из вас, дорогие и уважаемые читатели, протестировать данную модель и сформировать о ней свое объективное мнение - я буду очень рад. Потому что MJ - очень стильная.

Итак, большинство людей начинают с запросов к, скажем, условной Nano Banana PRO, вида "beautiful girl portrait 8k cinematic", получают что-то сносное - думают, что разобрались и в MJ все сработает так же. Не разобрались и не сработает.

В данном случае мы имеем как аналогию - съемку профессиональной камерой, но в дефолтном авторежиме. Да, красиво. Но красиво можно было и на телефон снять. Так, а зачем нам камера?

Статья будет длинная.

Как устроен промпт и на каком языке его писать.
Подробно про параметры.
Editor и другие функции интерфейса.
Примеры промптов.
Схемы работы с MJ.
Чем MJ8 отличается от MJ7.
Про доступность и цены.
Пару слов про API.

Немного душной базы

Midjourney работает на латентных диффузионных моделях. Берётся случайный шум, и модель шаг за шагом убирает его туда, куда указывает ваш текст.

Текст читает энкодер, близкий к CLIP - он ловит именно смысловые связи, а не отдельные слова. Потому "golden retriever sleeping by a fireplace in a cozy cabin" даёт совсем другой кадр, чем просто "golden retriever". Место и состояние меняют всё.

Midjourney - закрытая модель, архитектуру не раскрывают. Но вот с V7 модель явно начала лучше держать сложные инструкции - это видно по результатам, собственно, даже без документации.

Текущая версия - V8.1, вышла 14 апреля 2026. До неё дефолтом была V7 (не так давно нам даль альфу 8.0 потыкать). Переключить можно через настройки на сайте или --v 8 в конце промпта, но об этом чуть позже.

До 2024 года был только Discord-бот с командой /imagine. Сейчас основная точка входа - midjourney.com. Там есть вкладки Create (генерация), Edit (постобработка), Organize (галерея, коллекции) и Moodboard.

Discord никуда не делся, но системная работа делается через веб.

Да, и вот такой момент - Editor с inpainting и outpainting работает только в вебе.

Как устроен промпт

Midjourney читает текст слева направо, но не в обычном контексте, а в плане приоритезации. Начало весит больше и акценты будут расставляться соответственно.

Т.е. универсальная формула будет примерно такой: субъект и что он делает - окружение - свет и настроение - стиль или материал съёмки - параметры в конце. Не перечень атрибутов - а сцена.

А теперь клишированное сравнение двух вариантов.

Плохой: beautiful woman forest sunlight photorealistic 8k cinematic

Рабочий: A botanist in her 40s examining moss on ancient stone ruins, overgrown forest at dawn, soft diffused light filtering through mist, editorial photography, shot on Leica M11 50mm --ar 3:2 --s 250

Разница - не в длине. Первый - набор тегов, второй уже сцена. А модель понимает сцены.

На каком языке писать промпты

Миджорни понимает русский. Версии V6 и выше обрабатывают кириллицу вполне нормально - визуальная разница на большинстве запросов несущественная.

Но английский всё равно удобнее. Тут, к сожалению, личная субъективщина. Всё сообщество работает на нём. Готовые промпты, туториалы, базы стилей, шаблоны с Reddit и Midjourney Discord - всё это на английском. Если вы пишете по-русски, вы отрезаете себя от возможности копировать, ремиксировать и адаптировать чужие наработки напрямую.

Второй момент - технические термины рендера. Octane render, subsurface scattering, unreal engine - эти слова в обучающих данных шли в латинском написании. Да, разница может быть совсем небольшой, но зачем рисковать предсказуемостью результата без необходимости.

И параметры. --ar, --v, --style, --q - они всегда на английском, язык описания на них не влияет.

Проверяем теорию:

portrait of a woman, cinematic lighting, rim light, f/1.4, shallow depth of field, dark background, film grain, shot on Leica M6

портрет женщины, кинематографическое освещение, контровой свет, диафрагма f/1.4, малая глубина резкости, тёмный фон, зернистость плёнки, снято на Leica M6

Усложняем задачу. Модель видела имя в обучающих данных именно в латинском написании и в конструкции by [автор] . Давайте попробуем собрать стиль американского фотографа Грегори Крюдсона (он же Gregory Crewdson).

a woman standing alone in a suburban kitchen at night, dramatic cinematic lighting from above, fog, blue and amber tones, by Gregory Crewdson, large format photography, 8x10 film

женщина стоит одна на кухне в пригороде ночью, драматическое кинематографическое освещение сверху, туман, синие и янтарные оттенки, в стиле Грегори Крюдсона, крупноформатная фотография, плёнка 8x10

Как мы видим - результат сильно не меняется от языка написания.

Но, опять же, тут ничего рекомендовать не буду. Лично мне с 6й версии - удобно работать с английскими промптами (заранее извиняюсь, т.к. не хочу никого вводить в заблуждение). Если вам проще на русском - пишите на русском. Сама суть и структура промптов - одинакова.

Теперь с примерами и по порядку

Параметры ставятся в конец промпта через пробел. Каждый начинается с двух дефисов.

Да, маленькая вводная. MJ умеет собирать стиль с референсов и ниже мы этот вопрос разберем подробно. НО! Не будем тревожить правообладателей на изображения. Все ссылочки на исходники будут в промптах. Если будет интересно - откройте самостоятельно в новом окне, пожалуйста =)

--v - версия модели

Пишите --v 7 или --v 8. Сейчас по умолчанию стоит V8/V8.1. Хотите сравнить с предыдущей - указывайте в промпте. Без этого получите то, что стоит сейчас, а оно меняется.

--ar - формат кадра

Aspect ratio - один из самых важных параметров. Устанавливайте его в самом начале работы, под конкретную платформу.

Значение	Формат	Применение
--ar 1:1	Квадрат	Instagram, аватарки
--ar 4:5	Портретный	Instagram feed
--ar 9:16	Вертикальный	Reels, Stories, мобильные обои
--ar 16:9	Горизонтальный	YouTube, desktop wallpaper, кино
--ar 3:2	Фотографический	Печать, editorial
--ar 2:3	Книжный	Обложки, постеры
--ar 21:9	Ультраширокий	Cinematic, баннеры

Пример: misty mountain valley at dawn, aerial view --ar 16:9 --s 400

--s / --stylize - художественность vs точность

Шкала от 0 до 1000. По умолчанию - 100. Чем выше, тем больше MJ сам выбирает цвет, компоновку кадра и свет - то есть рисует по-своему, а не буквально по вашему тексту.

Диапазон	Поведение	Когда использовать
0-50	Максимально буквальная интерпретация	Продуктовое фото, техдокументация
50-150	Стандартный баланс (дефолт ~100)	Общие задачи
200-400	MJ художничает, сильная атмосфера	Editorial, концепт-арт
500-750	Сильная художественная интерпретация	Иллюстрации, обложки
750-1000	MJ ведёт, промпт - лишь намёк	Эксперименты, абстракция

sleek headphones on white marble --ar 1:1 --s 50 --style raw - снимаем наушники, точность нужна

jazz musician in a dimly lit club --ar 3:2 --s 350 - хотим красивый свет

abandoned underwater city, bioluminescent coral --ar 16:9 --s 750 - концепт, пусть MJ фантазирует.

--c / --chaos - разброс вариантов в сетке

Шкала 0-100. По умолчанию - 0. Управляет тем, насколько четыре варианта в сетке отличаются друг от друга. Chaos не делает картинки страннее - он делает их непохожими.

Значение	Результат
0	Все 4 изображения похожи, мелкие вариации
25-50	Умеренный разброс, всё в теме
75-100	Радикально разные варианты, возможны сюрпризы

Схема такая: ищете идею - --c 80-100, нужно разнообразие. Нашли направление, шлифуете - --c 0-15.

--w / --weird - нестандартность самого изображения

Шкала 0-3000. По умолчанию - 0. Не путайте с Chaos. Тот разнообразит сетку из четырёх, а Weird делает странной саму картинку - каждую по отдельности.

Значение	Поведение
0-100	Едва заметно
100-500	Необычные ракурсы, нестандартные цветовые решения
500-1500	Сюрреализм, неожиданные интерпретации
1500-3000	Полный эксперимент, непредсказуемо

Weird лучше работает с короткими промптами - модель сама придумывает детали, ей нужно место. ancient library at night, magic --ar 3:2 --w 800 --s 800 - странно и при этом красиво. Стоит попробовать.

Комбо: --weird 500 --stylize 500 - изображение выходит нестандартным, но визуально держится. Weird добавляет странность, Stylize следит за тем, чтобы это не рассыпалось.

--q / --quality - количество шагов диффузии

Значения: 0.25, 0.5, 1, 2. По умолчанию - 1. Чем выше, тем больше шагов делает модель - и тем дольше, и тем больше GPU тратит.

Значение	Время	GPU	Применение
--q 0.25	Очень быстро	Минимум	Тест промпта
--q 0.5	Быстро	Мало	Черновики
--q 1	Стандарт	Норма	Большинство задач
--q 2	Медленно	Двойной	Финальные изображения

Как работаем: сначала гоним всё на --q 0.5, выбираем что нравится, финал делаем на --q 2.

--no - что исключить

Пишите: --no текст, ещё текст. Это не буквальное удаление - модель просто тянется от этих слов подальше. Называйте конкретные предметы, а не расплывчатые состояния.

portrait of a scientist --ar 4:5 --no hands, fingers - убирает руки из кадра (классическая боль MJ)

product mockup --ar 1:1 --style raw --no text, watermark, logo, shadows - чистый рендер без артефактов

dramatic landscape --ar 16:9 --no people, cars, power lines - природа без следов цивилизации

--seed - воспроизводимость

Диапазон 0-4294967295. Тот же seed плюс тот же промпт дают похожий, но не точно такой же результат.

Найти seed в Discord просто: поставьте реакцию ✉️ на картинку - бот пришлёт всё в личку.

Пригодится, когда нашли удачный вариант и хотите серию в том же духе. Особенно важно, если снимаете одного персонажа в нескольких сценах.

--iw - вес изображения-промпта

Шкала 0.5-2. По умолчанию - 1. Работает, когда вы кладёте изображение в начало строки (не --sref). Чем выше число, тем сильнее картинка тянет результат к себе.

Чем --iw отличается от --sref: --iw берёт от исходника форму, цвет, компоновку - то есть что изображено. --sref берёт только стиль. Уветовую гамму, фактуры, настроение - но не переносит объекты.

https://ekskursii.by/images/obj2/16206/34_clear_resize1.jpg a cyberpunk version of this building --iw 1.5 --ar 16:9 - здание остаётся, стиль меняется

https://ekskursii.by/images/obj2/16206/34_clear_resize1.jpg same composition as watercolor --iw 0.7 --ar 3:2 - слабое влияние формы

--style raw - отключить "MJ фильтр"

Убирает автоматический лоск MJ. Результат трезвее, буквальнее.

Годится для техдокументации, документального фото, базы под 3D. Атмосферу срезает - если нужен настроенческий кадр, лучше без него.

industrial interior, factory floor --ar 16:9 --style raw --s 50 - цех как цех, без голливудского света

--tile - бесшовный паттерн

Рисует так, что изображение стыкуется само с собой - и по горизонтали, и по вертикали.

abstract botanical pattern, tropical leaves, art deco --tile --ar 1:1 - орнамент для ткани или обоев.

stone cobblestone texture, medieval, neutral tones --tile --ar 1:1 --style raw - текстура для игры.

Швы потом проверяйте вручную - MJ иногда не доводит их до идеала.

--draft - черновой режим

Появился в V7. GPU тратит меньше, ждёте меньше, деталей тоже меньше - но концепт уже понятен. Берите, когда нужно за минуты прощупать 10 вариантов логотипа или первый эскиз сцены.

modern restaurant logo, Mediterranean cuisine, minimal --ar 1:1 --draft --c 80 - быстро видите, куда двигаться.

--repeat / --r - повторная генерация

Запускает один промпт N раз подряд. --r 4 - четыре независимые генерации. GPU расходуется пропорционально. Хвататься за него стоит, когда нужен широкий разброс вариантов из одного задания.

--stop - остановить на N%

Шкала 0-100. Останавливает модель на N% пути - картинка выходит незавершённой намеренно. Не работает с 7й версией.

watercolor portrait of a woman --stop 60 --ar 4:5 - акварельный набросок с открытыми краями.

landscape --stop 40 --ar 16:9 --s 800 - полупейзаж, полуабстракция.

Параметр нишевый, но иллюстраторам стоит поиграть.

--niji - аниме и японская иллюстрация

--niji 6 включает отдельную модель для аниме. Результат не просто другой по стилю - по духу это другой инструмент.

two characters in a school courtyard, spring cherry blossoms --ar 16:9 --niji 6

И сравните сами с обычным V8 по идентичному промпту.

Редкие и специальные параметры

Параметр	Синтаксис	Что делает
--repeat	--r 4	Сгенерировать промпт N раз подряд
--stop	--stop 70	Остановить генерацию на N% - даёт незавершённость
--video	--video	Анимация процесса генерации (только Discord)
--niji	--niji 6	Режим аниме, японская иллюстрация
--turbo	--turbo	Максимальная скорость, минимальное GPU
--relax	--relax	Принудительный relax mode для конкретного задания

Референсы: sref, cref, oref, p

Отдельная глава. Четыре параметра. Они держат стиль и узнаваемость персонажа через десятки картинок. Самое мощное из всего, что есть в MJ.

--sref + --sw - Style Reference

Синтаксис: --sref [URL изображения] плюс --sw 0-1000 для интенсивности.

--sref переносит стиль: цветовую гамму, фактуры, свет, настроение. Что именно нарисовать - вы задаёте промптом. Это два разных канала, они не мешают друг другу.

a young girl reading in a magical library --sref https://media.craiyon.com/2025-09-01/NOA0MGnsR8iLbarfPyovOw.webp --sw 500 --ar 4:5 - берём стиль одной иллюстрации, рисуем другую сцену.

Можно смешать несколько стилей с весами.

dreamy landscape --sref https://img.freepik.com/free-photo/neon-gaming-background_23-2151932062.jpg::2 https://thumbs.dreamstime.com/b/calming-soft-hues-desert-view-background-dreamy-landscape-websites-blogpost-calming-soft-hues-desert-view-288654585.jpg::3 --sw 400

MJ не складывает их линейно, а интерпретирует соотношение.

--sw 100-300 - стиль едва чувствуется. --sw 500-700 - заметно. --sw 800-1000 - стиль перекрывает промпт. Получилось мутно - убавляйте.

Лучше всего работают картинки с выраженным авторским стилем: иллюстрации, живопись. Обычный стоковый снимок даёт слабый сигнал.

--cref + --cw - Character Reference

Синтаксис: --cref [URL с персонажем] плюс --cw 0-100 для степени точности.

--cref держит облик персонажа - лицо, причёску, черты - когда вы переносите его из сцены в сцену. Инструмент не идеальный, но для серийного контента незаменимый.

--cw 100 - берём всё: лицо, одежду, аксессуары. --cw 70 - лицо держится, одежду можно менять. --cw 0 - только общие черты лица, тело и одежда свободны.

Пример: [описание сцены 1] --cref [URL] --cw 70 --ar 16:9 и [описание сцены 2] --cref [тот же URL] --cw 70 --ar 4:5 - персонаж узнаваем, кадры разные.

Для --cref нужен чёткий портрет: хороший свет, лицо открыто, желательно анфас или три четверти. Групповая фотография с краем лица даст очень плохой результат.

Комбо: cyberpunk alleyway --cref [URL персонажа] --cw 60 --sref [URL стиля] --sw 400 - персонаж на месте, стиль сцены из отдельного источника.

cyberpunk alleyway --cref https://antikvariat.ru/upload/iblock/e2b/samuray.jpg --cw 60 --sref https://www.reddit.com/media?url=https%3A%2F%2Fi.redd.it%2Fj2d19lngsv861.jpg --sw 400

--oref - Omni Reference

Гибче cref. Держит не только людей - подойдёт для животных, предметов, любых объектов. [URL кота] in a garden picking strawberries --oref [тот же URL кота] --ow 80 - один и тот же рыжий кот, разные огороды.

--p - Personalization

MJ запоминает ваши вкусы, кстати. Вы оцениваете чужие картинки через кнопку Rate или /rate в Discord, и модель понемногу учится. --p применяет накопленное.

Чтобы профиль работал - оцените хотя бы 200-300 картинок. Оценивайте честно, а не по принципу "красиво". Иначе MJ просто усредняет чужой вкус. Публичные профили других пользователей подключаются по коду: --p abc123.

Мультипромпты и веса ::

Двойное двоеточие разрубает промпт на части - MJ обрабатывает каждую отдельно, не мешает их в кашу.

Без разделения hot dog space может выдать буквально горячую собаку в скафандре. С hot dog:: space:: - два самостоятельных образа.

Число после :: - вес. landscape::1 dramatic sunset::3 --ar 16:9 - закат главный, пейзаж фон. dark forest::2 mystical atmosphere::1 glowing mushrooms::1 - лес перетягивает.

Отрицательный вес вычитает: cyberpunk city::2 crowds::-0.5 - город есть, толпы нет. Работает не стопроцентно, но точнее, чем гнать это через --no.

Что за Editor

Editor открывается кнопкой "Edit" под любой картинкой на midjourney.com. Внутри - несколько режимов.

Paint (Inpainting)

Главный инструмент. Erase закрашивает то, что хотите поменять. Restore возвращает оригинал туда, куда закрасили лишнего. Размер кисти - ползунок или колёсико.

Порядок: Edit - Paint - закрашиваете область с запасом по краям (модели нужны соседние пиксели для понимания контекста) - пишете в строке промпта что должно быть вместо - Generate.

Remix Mode ON - промпт можно менять радикально. OFF - модель держится ближе к оригиналу. Меняете фон, сохраняете объект: OFF. Вставляете новый элемент: ON.

Проверено: "natural relaxed hands, same lighting and skin tone" - для правки рук. "dramatic sunset sky, golden hour, same color temperature" - для скучного фона. "continuation of the scene, stone floor" - когда нужно дорисовать низ кадра.

Smart Select

Кликаете на объект - инструмент сам обводит его по контуру. На простых формах работает чисто. На волосах, стекле, сложных краях - лучше рисовать кистью вручную.

Outpainting

Уменьшаете картинку через Move/Resize - по краям появляется серое поле. Это пустой кадр, который модель дорисует. Под каждое расширение обновляйте промпт: "continuation of the cityscape, same time of day". Расширяйте по одной стороне - проще контролировать.

Портрет 4:5 можно вытянуть в полный рост: ждёте вниз, промпт "continuation of the body, full length, same studio lighting".

Zoom Out

Та же идея. Картинка уменьшается внутри холста, модель дорисовывает вокруг неё. В Discord: кнопки "Zoom Out 2x", "Zoom Out 1.5x", "Custom Zoom" - последняя позволяет вписать своё число и заодно изменить пропорции кадра.

Vary

После увеличения три пути: Subtle - мелкие вариации, структура кадра не трогается. Strong - сильные вариации, компоновка может уехать. Region - уходите в Editor, там выбираете зону сами.

В V8.1 рендер сразу в 2K - увеличение разрешения часто не нужно. Проверьте размер файла раньше, чем тратить GPU.

Команды интерфейса

/describe - кидаете картинку, получаете четыре варианта промпта под неё. Используем, когда хотите понять, как MJ видит чей-то стиль, или восстановить промпт без истории.

/shorten - вставляете свой промпт, MJ показывает, что читает, а что пропускает. Первый шаг, когда что-то не работает. Часто выясняется: последние 30-40% текста модель просто игнорирует.

/blend - смешивает 2-5 картинок. Порядок важен. Первая весит больше.

/prefer option set - сохраняете набор параметров под коротким именем. /prefer option set brand value: --ar 3:2 --s 300 --v 8 --sref [URL] - и теперь --brand подтягивает весь набор сам.

/prefer suffix - каждый промпт автоматически получает хвост с вашими параметрами. Работаете всегда в 16:9 с одними настройками - один раз прописали, не повторяете.

Немного примеров

Ниже - небольшая пачка промптов, так сказать, усвоить материал. Промпты. Все же их так любят на ХАБР (нет).

Поэтому - вот тут у нас скролл сразу к примеру схемы работы с MJ.

Портреты и люди

Editorial мода со сложным светом: A model in an oversized cream wool coat standing at a windy sea cliff, salt-bleached rocks, grey North Sea horizon, editorial fashion photography, Hasselblad 503CW, medium format, overcast soft light --ar 3:4 --s 350 --v 8

Документальный без приукрашивания: An elderly ceramicist working at her wheel, clay-covered hands, afternoon light through a dusty workshop window, photojournalism, Leica M11, natural color grading --ar 4:5 --s 150 --style raw

Лист персонажа для анимации: Character design sheet: young female botanist explorer, 1920s, practical khaki field suit, front view, side view, three-quarter view, white background, flat color fills --ar 2:1 --s 200

Кинопортрет в движении: A jazz saxophonist mid-performance, amber stage light, motion blur on hands, focus on face, 35mm Kodak film, cinematic --ar 3:2 --s 400 --c 15

Пространства и архитектура

Биофильный офис: Interior of a biophilic corporate headquarters, 12-meter living wall, cascading water feature, exposed concrete and warm oak, soft skylight, architectural photography --ar 16:9 --s 300

Брутализм с акцентом: Brutalist apartment block in Belgrade, 1970s, overcast sky, a lone figure in a red coat at the entrance - one spot of color in the grey, documentary style --ar 3:2 --s 200 --style raw

Sci-fi интерьер: High-security orbital research station interior, 2180, white curved corridors, blue emergency lighting, holographic displays, Dune aesthetics --ar 21:9 --s 500

Ночной Токио снизу: Looking up at skyscrapers at night, shibuya district, rain and neon reflections on wet pavement, extreme vertical composition, Sony A7R V --ar 9:16 --s 350

Природа и стихия

Исландский вид сверху: Aerial drone view of volcanic lava field in Iceland, black basalt with vivid green moss, multiple lava channels, overcast natural light --ar 21:9 --s 300 --v 8

Дайвер в ламинарии: A freediver descending through a kelp forest, shafts of light from above, Pacific Northwest, wide angle, blue-green depth, Nikon Z series --ar 9:16 --s 400

Зима, минимализм: Lone birch tree on a frozen lake at dawn, light snow, perfect stillness, reflection in the ice, Japanese ink painting aesthetic, very limited palette --ar 1:1 --s 600 --style raw

Иллюстрация и графика

Арт-деко постер: Art deco illustration of a woman in a speakeasy, geometric gold and black, flat perspective, 1920s fashion, Tamara de Lempicka inspired --ar 2:3 --s 500

Детская книга: A young fox cub discovering a glowing mushroom in an autumn forest, gentle watercolor, warm palette, children's book illustration --ar 4:3 --s 400

Creature design лист: Deep sea bioluminescent predator, apex predator at 8000m depth, transparent body, multiple jaw systems, scientific illustration meets monster design, white background reference sheet --ar 3:2 --s 300

Графический роман: Black and white graphic novel panel, hacker in a server room, Dutch angle, heavy inks, stark shadows, Frank Miller aesthetics --ar 3:2 --s 500 --style raw

Flat для SaaS: Flat design illustration: remote team collaborating, pastel palette (soft teal and warm coral), simple geometric characters, SaaS product homepage --ar 16:9 --s 200

Продукт и бизнес

Технологический продукт: Premium wireless earbuds floating, matte black with rose gold accents, subtle lens flare, studio photography, clean white background, 3/4 angle --ar 1:1 --s 100 --style raw

Ресторанная еда: Bowl of Japanese ramen, perfect soft-boiled egg halved, steam rising, dark rustic ceramic on aged cypress wood, water droplets on chopsticks, overhead 2/3 angle, professional food photography --ar 4:5 --s 200

Lifestyle для бренда: A woman in her 30s pouring artisan coffee into a ceramic mug, natural light, linen clothes, calm atmosphere, editorial photography, lifestyle brand --ar 4:5 --s 300

Эксперимент

Typographic art: The word VOID made of collapsing stars, 3D letterforms, cosmic scale, photorealistic physics, deep space background --ar 1:1 --s 600

Macro неожиданное: Macro photograph of vinyl record surface, grooves as mountain ranges, dust as boulders, raking light from the left, scanner photography --ar 1:1 --s 350

Pulp sci-fi: 1950s pulp science fiction magazine cover, rocket explorers on Venus, bold primary colors, painted illustration, retro-futurism --ar 2:3 --s 500

Weird + beautiful: ancient library at night --ar 3:2 --w 800 --s 800

Бесшовная текстура: Liquid metal texture, chrome and silver, abstract fluid shapes, photorealistic 3D render --tile --ar 1:1 --s 200

А вот пример схемы работы с MJ

Персонаж для книги или игры

Разведка: character design exploration: female warrior, fantasy medieval, practical armor, dark skin, natural hair in braids, mid 30s, commander type --ar 4:5 --draft --c 80. Смотрим, выбираем.

Отобрали - убираем --draft, добавляем --q 2, записываем seed. Потом лист персонажа: same character: front view, side view, back view, expression sheet, white background --cref [URL] --cw 100 --ar 3:1. Сцены с персонажем - через --cref [URL] --cw 70.

Референсная доска бренда

Начинаем с разведки: --draft --c 70. Из понравившихся картинок берём URL, назначаем --sref. Все материалы бренда - через --sref [URL] --sw 600. Финально прячем всё в /prefer option set brand value: --sref [URL] --sw 500 --s 300. Теперь --brand подтягивает брендинг сам.

Editorial серия для статьи

Сначала рисуем один образцовый стиль: editorial flat illustration: abstract concept, limited palette (deep blue, white, orange), clean lines, modern editorial --ar 16:9 --s 400. Запоминаем URL. Дальше все иллюстрации: editorial illustration: [новая тема] --sref [master URL] --sw 700 --ar 16:9 --s 400. Все пять выходят как серия.

Правка проблем через Editor

Руки не те: Paint - Erase по рукам с запасом - "natural relaxed hands, fingers extended, same lighting and skin tone" - Remix Mode OFF.

Фон скучный: Smart Select на персонаже - Restore его маску - Erase всё вокруг - "dramatic sunset sky, golden hour".

Мало места в кадре: Move/Resize - уменьшаете картинку - оставляете поле снизу - "natural continuation of the scene, [что должно быть]".

Что умеет V8, чего не умел V7

На самом деле, модель в альфе сейчас и вышла совсем недавно. Возможно, кто-то даже и пропустил эту новость. Так вот.

Текст внутри изображений. Главное новшество. V8 рендерит слова, буквы, надписи прямо на картинке - с приемлемой точностью. Вывеска, обложка книги, постер, кружка с надписью, открытка в рамке. В промпте просто ставите кавычки вокруг нужного текста:

a vintage poster with the text "Good Morning" in bold serif font, warm colors --ar 2:3 --s 300

a coffee mug with the inscription "Monday Again" on a wooden table --ar 1:1 --s 200 --style raw

Важно: короткие фразы работают лучше. Длинные предложения - хуже. Кириллица - слабее, чем латиница, но уже читаема. Специальные шрифты задавайте словами: hand-lettered, sans-serif, typewriter, chalk on blackboard.

Скорость. V8 работает в 4-5 раз быстрее V7. Черновик в черновом режиме - за несколько секунд. Финальная генерация - 15-20 секунд в Fast-очереди.

Анатомия. Руки, пальцы, зубы - стали заметно лучше. Но многорукие многопальчатые многоноги все еще с нами.

Нативное 2K. Рендер сразу отдаёт 2048px по длинной стороне. Во многих задачах апскейл больше не нужен.

Следование промпту. Сложные составные сцены с несколькими объектами и конкретными взаимоотношениями - V8 держит, на удивление, лучше.

Что там по деньгам

Тариф	Месяц	Год (-20%)	Fast GPU / мес	Relax	Stealth
Basic	$10	$8/мес	3.3 ч (~200 img)	нет	нет
Standard	$30	$24/мес	15 ч	безлимит	нет
Pro	$60	$48/мес	30 ч	безлимит	да
Mega	$120	$96/мес	60 ч	безлимит	да

Fast - приоритетная очередь, 5-20 секунд. Relax - ждёте по загруженности, 1-5 минут. Ищете концепты - берите Relax. Клиент ждёт к обеду - Fast. Если лимит кончился - докупить час стоит $4.

Stealth Mode (Pro и Mega) - ваши картинки не светятся в публичной галерее. Нужен при NDA: промпты и образцы не должны всплыть у чужих.

Коммерческие права - у всех платных тарифов. Если компания зарабатывает больше $1 млн в год - нужен Pro или Mega. Но как они это будут вычислять на наших просторах - непонятно.

Ну и про доступность для нашего пользователя. Сайт доступен, можно залогиниться и потыкать галерею. Можно потыкать стили. Хотите начать пользоваться инструментом - необходимо преобрести подписку. А вот оплатить картами банков РФ и РБ, увы, нельзя.

Да, по закону - Midjourney берёт ответственность за данные, на которых обучалась модель. Это прописано в пользовательском соглашении. Портрет живого человека без его согласия - серая зона в большинстве стран (нет). Рисовать в стиле конкретного художника - формально законно, но на ДевианАрт с этим лучше не ходить.

Пару слов про API

У Миджорни нет официального публичного API. Это осознанная позиция компании. И по состоянию на апрель 2026 года ситуация не изменилась.

Да, существует множество сервисов, которые предлагают воспользоваться MJ на своей платформе. Но тут уже речь идёт об обёртках над Discord-ботом. Такие решения эмулируют действия пользователя. Они там авторизуются от вашего имени, отправляют команды боту, возвращают результат. Т.е., с технической точки зрения это автоматизация интерфейса, а не работа с API в классическом смысле.

Использование подобных прокси нарушает пользовательское соглашение Миджорни (и Дискорда). Компания это отслеживает и блокирует аккаунты - без предупреждения и без возврата средств за подписку.

Следовательно, единственный легитимный способ работы с сервисом - вручную через веб-интерфейс на midjourney.com или через Discord-бот.

Вот такой гайд получился. Очень старался охватить максимум полезной информации. Теперь с этими знаниями можно идти тестировать V8.1 - как раз позавчера вышла. Наобещали там всякого. И HD по умолчанию, и стандарт как черновой V7, и новый multi-cref до трёх персонажей сразу. Кому интересно - вот официальная площадка альфа версии.

Комментарии (19)

AdrianoVisoccini
16.04.2026 16:01
#29840306
портрет женщины, кинематографическое освещение, контровой свет

Смотрим на картинку, не видим контровго света. Интересненько
вот пример контровика если что

можно его и при других схемах использовать само собой, но контровик даже по названию понятно что должен контрить камеру, т.е светить с обратной стороны...
1. AdrianoVisoccini
  16.04.2026 16:01
  #29840308
  dramatic cinematic lighting from above
  
  На картинке контровик, никакого from above нет
  ну само собой)
  1. AdrianoVisoccini
    16.04.2026 16:01
    #29840312
    underwater city
    
    НА картинке город над водой...
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840360
    afternoon light through a dusty workshop window,
    
    Явный день, окно чистейшее
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840376
    white curved corridors, blue emergency lighting,
    
    Подсветка 3500К, не голубая
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840388
    young fox cub discovering a glowing mushroom in
    
    Очевидно что не glowing
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840394
    transparent body, multiple jaw systems,
    
    Body не transparent
    
    Челюсть одна
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840404
    hacker in a server room
    
    Это что угодно но не серверная
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840414
    remote team collaborating
    
    Все а одном месте
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840434
    Bowl of Japanese ramen, perfect soft-boiled egg halved, steam rising, dark rustic ceramic on aged cypress wood, water droplets on chopsticks
    
    Нет пара, как и капель на палочках
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840442
    : A woman in her 30s
    
    Скорее 50s
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840458
    The word VOID made of collapsing stars,
    
    На картинке явно какие-то техногенные штуковины и никаких звездов
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29840466
    
    Macro photograph of vinyl record surface, grooves as mountain ranges, dust as boulders, raking light from the left, scanner photograph
    
    Свет не слева
    
    Neyroskuf Автор
    16.04.2026 16:01
    #29840504
    Огромное Вам спасибо, что так детально читаете статью. Но, при всем уважении, Ваши комментарии - это пример того, что я описывал ранее. Т.е. тут - буквальное отношение text-to-image к инструменту, который работает иначе. MJ не рендерит промпт как техзадание - он генерирует образ, ассоциативно связанный с промптом. Промпт это не спецификация, это вектор настроения, эстетики и жанра. Поэтому "dramatic cinematic lighting from above" не даёт контровик - потому что это, скажем, кинематографически ассоциируется с драматическим светом, а не потому что MJ не читает "above" как технический параметр. "Underwater city" даёт город над водой - потому что это тоже входит в семантическое поле подводной эстетики. Как то так.
    
    Да, соглашусь, с Вашими замечаниями Nano Banana справится лучше.
    
    DirOr
    16.04.2026 16:01
    #29840566
    тогда сразу становится непонятно, зачем писать про контровой свет, если он так и так не появится, а, цитирую: "... не спецификация, это вектор настроения, эстетики и жанра". Это какой-то нонсенс получается!
    
    Ну и вдогонку, а вот "- no" и проч. доступные системе ключи можно одним списком с расшифровкой у MJ получить, ну, нажав F1, например?
    
    И еще вдогонку 2.
    
    А есть какой-то промпт, типа "- no ai" - сделай картинку фотореалистичной, но непохожей на сгенерированную нейросетью? Ну девочка будет не обязательно рыжей, вся усыпанная веснушками и вот это вот всё?
    
    Neyroskuf Автор
    16.04.2026 16:01
    #29840706
    Да, MJ не гарантирует следование световым схемам без дополнительных параметров. Промпт задал направление, но не схему. В этом и есть особенность инструмента - он интерпретирует, а не исполняет. Если нужен точный контровик - используем --style raw --s 50 плюс физическое описание.
    
    Т.е. вот промпт из статьи + параметры. Ну и результат.
    
    portrait of a woman, cinematic lighting, rim light, f/1.4, shallow depth of field, dark background, film grain, shot on Leica M6 --style raw --s 50 --chaos 0
    
    DirOr
    16.04.2026 16:01
    #29841196
    спасибо, понятно
    
    т.е. пока по-прежнему далеко от того что нужно
    
    из того что реально есть на картинке:
    
    1) portrait of a woman
    
    2) rim light
    
    3) dark background
    
    остальное словесный мусор, типа film grain и shot on Leica M6
    
    AdrianoVisoccini
    16.04.2026 16:01
    #29842836
    Само собой я это не серьезно. Меня просто как немного фотографа тригернуло то что использование специального термина "контровик" привело к его отсутствию, а наличие light from above буквально в следующей картинке привело как раз к контровому свету(хотя технически говоря это не контровое освещение). Дальше я просто ради хохмы докопался до каждой строчки

LiliJulie
16.04.2026 16:01
#29840732
Наконец-то в V8 нормально завезли текст внутри картинок, этого года три ждали