Ранее мы рассказывали о своих впечатлениях и результатах тестирования приложений на основе нейросети. В работе над платформой «РСХБ в цифре» мы активно используем Midjourney. В новой статье хотим поделиться своими наработками, которые помогут с нуля разобраться в основных функциях и командах (версия Midjourney 5.1), чтобы приступить к созданию интересных изображений с помощью этого приложения.
![](https://habrastorage.org/getpro/habr/upload_files/1be/c9d/2ff/1bec9d2ff959765232ed7f62bb4e5c5e.jpg)
Сейчас использовать Midjourney можно только через Discord, где создается учетная запись. Midjourney отображается в Discord отдельным общим сервером, где разные пользователи генерируют изображения в общих чатах. Ещё бота можно добавить на свой личный сервер и взаимодействовать без посторонних людей.
На изображении отмечены общий сервер Midjourney с различными каналами для генерации изображений, и личный, в который можно добавить чат-бот.
![](https://habrastorage.org/getpro/habr/upload_files/b0a/0f2/9d4/b0a0f29d47d31f80b7c6e606c94cc1e3.png)
Как работают команды Midjourney в Discord
Взаимодействие с ботом Midjourney в Discord происходит с помощью команд. Команды используются для создания изображений, изменения настроек по умолчанию, отслеживания информации о пользователе и выполнения других полезных задач.
Основные команды
/imagine
— генерирует уникальное изображение из короткого текстового описания.
/settings
— открывает поле с упрощенными настройками генерации, качества, приватности и т. д.
![](https://habrastorage.org/getpro/habr/upload_files/e57/8e8/8c5/e578e88c51f86183a7132ce8060d0e54.png)
В окне быстрых настроек можно выбрать:
версию Midjourney;
режим рисования в анимационном стиле (Niji);
параметр «Style» (по умолчанию стоит 100 или «Style med», но для придания изображению большей художественной выразительности его можно увеличить);
«Public mode» включен по умолчанию; возможность сделать фотографии недоступными для публичного просмотра другими участниками есть только в самом дорогом тарифе , команда также активируется через
/private
;«Fast mode» или скорость генерации (по умолчанию стоит быстрая или «Fast mode» — если убрать данный режим, то не будет тратиться машиновремя подписки, но генерация изображения может длиться довольно долго, команда также активируется через
/relax
);-
«Remix mode» дает возможность вносить изменения в запрос при использовании параметра «Make Variations» после увеличения изображения (об этом чуть ниже);
/info
— вызывает окно с информацией по подписке.
/subscribe
— вызывает окно с возможностью перехода к тарифным планам.
![](https://habrastorage.org/getpro/habr/upload_files/b22/d9f/68f/b22d9f68ff9bf3f1bdb8156a6385bc0c.png)
/blend
— помогает скрещивать изображения, когда мы хотим из нескольких получить нечто общее. Без этой команды тоже можно создать смешанное изображение, но подгружая несколько ссылок и описывая результат.
![](https://habrastorage.org/getpro/habr/upload_files/a95/615/105/a956151053ff32bf3a9014b3b57c7bd1.png)
/prefer option set
— позволяет сохранить часто используемые настройки: вводим команду, далее указываем название для настройки, а после сам параметр через элемент «--».
Пример:
/prefer option set
mine
--hd --ar 16:9
промт создает опцию под названием « mine
», при вводе которой в строку запроса как --mine
Midjourney будет считывать ее как --hd --ar 16:9
Все созданные настройки можно посмотреть через команду /prefer option list.
/help
— показывает полезную информацию и советы о боте Midjourney.
Подробнее про генерацию изображений с /imagine prompt
1. Введите /imagine prompt:
или выберите /imagine
команду во всплывающем окне команд с косой чертой.
2. Введите описание изображения, которое вы хотите создать, в prompt
поле.
3. Отправьте свое сообщение.
![](https://habrastorage.org/getpro/habr/upload_files/eb4/332/4b1/eb43324b193bb9cbf9d62e6724e768b3.png)
Midjourney Bot лучше всего работает с простыми короткими предложениями. Длинные запросы могут ломать логику на сгенерированном изображении или приводить к некачественным результатам.
После завершения генерации появляются изображения и несколько дополнительных командных кнопок:
![](https://habrastorage.org/getpro/habr/upload_files/96d/bef/76b/96dbef76b59e2d9b2aafce94727961bc.png)
U1
U2
U3
U4
Кнопки U масштабируют изображение, создавая увеличенную версию выбранного изображения (увеличенное изображение будет немного отличаться от оригинала).
V1
V2
V3
V4
Кнопки V создают небольшие вариации выбранного изображения сетки. При создании варианта создается новая сетка изображения, аналогичная общему стилю и композиции выбранного изображения.
![](https://habrastorage.org/getpro/habr/upload_files/7e4/7eb/519/7e47eb5191013e2921926b6c6e69be8a.jpg)
Кнопка «Обновить» генерирует новые изображения под текущий запрос.
После использования масштабирования изображения (Кнопки U) появится новый набор параметров:
![](https://habrastorage.org/getpro/habr/upload_files/27e/4cb/32f/27e4cb32fcb9b1217a6ba22d0f275765.png)
![](https://habrastorage.org/getpro/habr/upload_files/637/316/ad9/637316ad90544960a28ecbb6632d6b4a.png)
«Make Variations» создает новый набор из четырех вариантов на основе текущего.
«Web» открывает изображение в своей галерее на Midjourney.com.
«Favorite» помогает отметить лучшие изображения, чтобы их было легко найти на веб-сайте Midjourney.
Недавно была добавлена новая функция «Remaster», не просто генерирует варианты по запросу, а дорабатывает уже сформированный вариант.
Чем крупнее объект на изображении, тем больше шансов, что «Remaster» сработает хорошо. Чем мельче детали, тем сложнее Midjourney заметить и переосмыслить их.
Сейчас функцию «Remaster» убрали, появится ли она снова — ответа нет.
![](https://habrastorage.org/getpro/habr/upload_files/4d2/306/06a/4d230606a7c889c8d9a17bc8603cfaa1.png)
Для получения результата, максимально приближенного к желаемому, запросы в Midjourney лучше писать, придерживаясь определенной структуры после /imagine prompt
:
1. сюжет изображения;
2. стиль изображения;
3. информация о размере, освещение и т.д.
Для разделения запроса на составляющие необходимо использовать запятые или двоеточие (при необходимости строгого разграничения).
Пример:
beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day: : illustration style: : --ar 16:9
![](https://habrastorage.org/getpro/habr/upload_files/dfc/3e3/1f4/dfc3e31f4909a6ce1e7d1f9eb88df5f0.png)
Дополнительные установки в запросах
Важно! Midjourney одинаково воспринимает два коротких дефиса «--» и длинное тире «—»
--ar
— устанавливает четкое соотношение сторон.
--q
— устанавливает качество изображения; по умолчанию качество равно 1 (--q 2 – увеличивает детализацию, но тратит больше машиновремени, --q 0.5, --q 0.25 соответственно, уменьшает качество, но тратит меньше машиновремени; --q 5 – экспериментальная настройка)
--no
— исключает детали, например «--no cow»
будет означать отсутствие коров на изображении (во всяком случае Midjourney попытается их не делать).
--uplight
— позволяет при масштабировании изображения (кнопка U) уменьшить отличие от оригинала (при увеличении изображения всегда есть небольшая разница, особенно в небольших деталях).
::<число>
— если добавить значение от -1 до 2 к любому слову в запросе (в данном случае без пробелов), можно распределить условный вес запроса, то есть важность той или иной подсказки перед другими. По умолчанию значение 1. -1 -0.5 равно команде –no.
Пример:
по запросу «/imagine prompt: hot dog::1.5 food::-1»
будет создана «горячая собака», не еда; а по промту «hot dog»
будет создана сосиска. Если использовать просто «/imagine prompt: hot:: dog»
разделение будет аналогичное.
![Разные результаты генерации разных запросов Разные результаты генерации разных запросов](https://habrastorage.org/getpro/habr/upload_files/121/5cb/d30/1215cbd30df8d9a78969fdfcaea09773.png)
Когда двойное двоеточие «::»
используется для разделения подсказки на разные части, можно добавить число сразу после двойного двоеточия, чтобы назначить относительную важность этой части подсказки.
Пример:
hot:: dog
сгенерировал горячую собаку. Изменение подсказки на hot:: 3 dog
делает слово «горячий» в два раза важнее слова «собака».
![Результат генерации Результат генерации](https://habrastorage.org/getpro/habr/upload_files/468/df9/3f3/468df93f3fefa833e21c3eb6fe791e22.png)
--iw <число>
— устанавливает вес изображения относительно веса текста.
--chaos <число>
— вносит разнообразие в результаты. Диапазон значений от 0 до 100. Чем выше значение, тем необычнее будет композиция, но в ущерб самому запросу.
Пример:
beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --chaos 100
![Вот что создала нейросеть Вот что создала нейросеть](https://habrastorage.org/getpro/habr/upload_files/976/7c1/6ea/9767c16eaaabfc5e73ee784c46cbb412.png)
Пример:
beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --chaos 0
![Совершенно иное видение запроса Совершенно иное видение запроса](https://habrastorage.org/getpro/habr/upload_files/14f/71c/629/14f71c629778e6d99a986340c26b16be.png)
На втором изображении в запросе мы лишь изменились число, написав «0» вместо «100», а результат получили совершенно иной.
--seed
— применяется при необходимости создавать максимально похожие изображения; диапазон значений от 0 до 4294967295. Если параметр не указан, автоматически выбирается случайное число.
Пример:
beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --seed 1234567
![](https://habrastorage.org/getpro/habr/upload_files/b36/ed0/cbd/b36ed0cbdcafe50c65a262499e6cf096.png)
--s <число>
— стилизация изображения: чем выше значение, тем выше стилизация.
Например, «--s 500»
.
![Пример использования стилизации Пример использования стилизации](https://habrastorage.org/getpro/habr/upload_files/b5c/985/131/b5c985131f6fd42a11a17b28b24a3733.png)
Немного о дополнительных промтах
Ракурс, угол, план и освещение
Берем промт:
beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9
Изображениям в Midjourney можно задавать ракурс. Мы можем получить как портрет, так и вид с высоты птичьего полета. Сразу уточню, срабатывает не всегда на 100%, т.к. очень многое зависит от длины и сложности самого запроса, но, тем не менее, знать об этом стоит.
Когда необходимо получить изображение с прямой перспективой, то дополнительно следует указать «Looking into the camera»
или «full-face
». Однако Midjourney часто сам предлагает именно такие визуалы.
Если требуется вид сверху, то самые простые варианты «drone shot photo of»
или «birds-eye-view photo».
Варианты похожи, но также могут варьироваться в зависимости от запроса.
Пример:
Drone shot photo of Beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9
![](https://habrastorage.org/getpro/habr/upload_files/a07/f4f/af5/a07f4faf51c8bc5c7141e3e111d71a7e.png)
Пример:
birds-eye-view photo Beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9
![](https://habrastorage.org/getpro/habr/upload_files/bb4/cdc/990/bb4cdc990329c00449954c8d6dd7497e.png)
Также можно немного приподнять угол обзора при помощи ввода указания «High- angle photo of» или опустить камеру через запрос «a hip/knee/ground level shot of» (срабатывает чаще) или «view from below».
![Результат использования запроса «view from below» Результат использования запроса «view from below»](https://habrastorage.org/getpro/habr/upload_files/b1a/2d8/a20/b1a2d8a205d4029f9896a0e40dd9f9e9.png)
Вид снизу и не очень (иногда и такое бывает). Иллюстрации ниже.
![](https://habrastorage.org/getpro/habr/upload_files/e24/17f/188/e2417f188745b89f64640f690d933856.png)
![](https://habrastorage.org/getpro/habr/upload_files/2de/1e1/182/2de1e11828e0663cef46a423d674fc87.png)
При необходимости получить определенный угол обзора, используем «in profile»
, «three quarter view»
, «back view
». Сразу уточню, что на людях данные настройки работают определенно лучше, но т.к. у нас корова, будем работать с ней.
![Использование «in profile» Использование «in profile»](https://habrastorage.org/getpro/habr/upload_files/6cb/7f6/09a/6cb7f609a26006210aae1833490096e6.png)
![Результат использования «three quarter view», Результат использования «three quarter view»,](https://habrastorage.org/getpro/habr/upload_files/8d9/a95/0a1/8d9a950a1ff49a363cb5a1b4b6c9480e.png)
![Использование «in profile» Использование «in profile»](https://habrastorage.org/getpro/habr/upload_files/d8a/69c/92d/d8a69c92d6efdfde0cb28430afa7cbbf.png)
Изображение можно сделать разного плана: портрет, средний план, в полный рост или издалека. Для этого к запросу добавляем «closeup photo»
или «closeup shot»
, «medium-full photo/shot»
, «full photo/shot»
или «full body photo/shot»
.
Соответственно, если хотим изобразить группу объектов, помещающихся на изображении целиком или видимые издалека, используем «long photo/shot»
, «a wide photo/shot»
и «view from afar»
. Попробуем также эффект рыбьего глаза или «GoPro».
Важно! Обратите внимание: использование в запросе противоречащих друг другу описаний не будет приводить к желаемым результатам, например, мы хотим получить вид издалека, но, при этом, указываем на довольную морду коровы или высокую детализацию шерсти.
Для примеров «long photo»
и «view from afar»
сделаем запрос чуть проще: cow in a meadow, --ar 16:9»
![](https://habrastorage.org/getpro/habr/upload_files/244/2a1/e27/2442a1e277e8b0bc5ebff645c0080d03.png)
![«medium-full photo» «medium-full photo»](https://habrastorage.org/getpro/habr/upload_files/6c2/abd/d3f/6c2abdd3fbd0416f270c46d3b14e5b23.png)
![«full body photo» «full body photo»](https://habrastorage.org/getpro/habr/upload_files/e42/70e/ea8/e4270eea8aa27a5fbd7e0e54a377f1db.png)
![«long photo» «long photo»](https://habrastorage.org/getpro/habr/upload_files/f90/f55/c22/f90f55c226f0979f0f774700fc226f66.png)
![«view from afar» «view from afar»](https://habrastorage.org/getpro/habr/upload_files/e83/876/910/e83876910d3d9e0170907a86783dca60.png)
Эффект рыбьего глаза тоже выглядит довольно интересно, добавляем «GoPro»
![](https://habrastorage.org/getpro/habr/upload_files/19c/e4b/cd9/19ce4bcd95b5203c4fbe657d1483b949.png)
По вариантам простого освещения все предельно легко. Необходимо просто указать в запросе тот временной интервал или источник света, который необходимо получить, например: «sunny afternoon»
, «daylight»
, «incandescent light»
, «backlighting»
и т.д.
В конце
Midjourney является отличным инструментом для дизайнеров, иллюстраторов и многих других людей творческих профессий. Этот инструмент позволяет воплощать в жизнь самые смелые идеи, создавать необычный и уникальный контент в различных стилях и вариациях. Желаемый результат не всегда получается с первого и даже с десятого раза, но, тем не менее, пробуйте и экспериментируйте.
Dmitry2019
А вот интересно, можно ли как-то трансформировать промпт Midjourney, с овсеми флагами и ключами, в аналогичный для Stable Diffusion?
MountainGoat
Не "можно", а "год назад сделано и везде есть". Документация.
Есть модель, которая рисует точно как MidJourney, у меня её просто нет.
SystemXFiles
А какая модель, подскажите, пожалуйста?
MountainGoat
https://huggingface.co/prompthero/openjourney
SystemXFiles
Спасибо! Пробовал ее и к сожалению до MidJourney в плане простоты получения хороших результатов ей далеко
MountainGoat
А про просто никто и не говорил. Midjourney сходу выдаёт хорошие результаты, но они как книги Терри Прачетта - сначала восхищают, а после третьей-пятой совсем не интересно, потому что они все одинаковые.
Если вы хотите результат, который нужен вам, а не ему - то Midjourney вам не поможет. У него просто нет таких возможностей контроля за результатом.
HiLander
Это вы мало книг Пратчетта читали просто... Или сконцентрировались только на основном сюжете "Плоского мира"...