Меня зовут Андрей Цыган - я предприниматель, управленец и как энтузиаст исследую возможности нейросетей. Я никогда не работал ни с графическими редакторами, ни даже с PhotoShop - но постоянно нуждался в таких услугах. Качественные изображения мне были нужны для презентаций, маркетинговых материалов, соц. сетей.
Из всех сетей генерации изображений мне больше всего понравился Midjourney - оптимальное качество на потраченное время. Я понимаю в самом Midjourney (не говоря про Stabble Diffusion) можно углубиться в детали - но я не дизайнер или AI artist, мои задачи прикладные.
У меня уже сгенерированно более 4000 изображений и я выделил 10 методов, которые позволяют достаточно быстро и качественно получить нужный мне контент. Они могут использоваться как обложка к посту или лонгриду, или я чаще использую в презентации. Я хорошо помню ту боль и страдания поиска нужной картинки, в достойном качестве, нужных пропорций чтобы подчеркнуть мысль. Иногда на это уходило времени больше, чем на текст и буллеты презентации. Вот пример какие сейчас у меня, без дизайнера, получаются презентации:
Это конечно не варианты для выставки работ, создания нейрокартины, элемента брендинга - но предпринимателям не всегда нужен такой перфекционизм.
1. Начинаем с простого промта
Всё гениальное - просто) Сам Midjourney пишет - не усложняйте. Промты размером в томик "Войны и Мир" он полностью не читает.
Важно помнить - что мы должны описывать не процесс, чувства персонажей - а описывать конечную картину. Представьте что она у вас есть - и просто опишите её. Для начала я всегда начинаю с этого метода, в 70% я получаю результат и пошёл дальше.
Товарищ Midjourney понимает только английский язык, поэтому, если с ним "на Вы" - идём в Deepl . Посмотрим пример - мне в подводке нужно было рассказать про карго-культ и нужны атмосферные картинки
Что можно ещё добавить:
Соотношения сторон. Понимая применение картинки мы будем знать размер. Midjourney оперирует не пикселями, а соотношением. Если нужно перевести, можно использовать калькулятор. К примеру, слайд - 16:9, сторис - 9:16, пост в инстаграм - 1:1. Когда делаю презентацию, я сначала прописываю текст, а потом "на глаз" сколько осталось места. В Midjourney это задаётся параметром --ar 16:9 (вставить свои цифры)
-
Фон и цвета. Перед началом презентации я понимаю, какой буду использовать фон и основной цвет, очень классно смотрятся картинки которые сочетаются с цветами заголовка.И тогда добавляем после нашего промта цвет фона и цвет линий: белый фон и оранжевые цвета/чёрный фон и красные цвета
-
Требуется именно фото. Иногда по простому описанию MJ может делать иллюстрации. Есть множество способов намекнуть MJ что мы хотим именно фото - я использую в начале промта Photo of "ваш запрос". Ниже пример один и тот же запрос - иллюстрация и фото
Используем разные версии. В MJ сейчас порядка 10 рабочих версий, и номер версии не значит что она именно хуже - она рисует по другому. И иногда даже более старые версии могут рисовать лучше.Для этого используем функцию "перебора" и вставляем такую конструкцию. Предварительно отключите в настройках "style raw" .
--v {4 {--style {4a, 4b, 4c}}, 5{a, b,.1,.1 --style raw,.2,.2 --style raw}}
Мы получаем сразу 9 генераций по одному промту в разных стилях. Иногда в предыдущих версиях может быть более интересный результат.
2. Изменяем странность картинки
В версии 5.2 был добавлен новый параметр--weird
- странность картинки. Если полученные изображения вам показались очень скучные, можно применить его. Значение варьируется от 0 до 1000. Можно сделать мультипромт и сразу указать 4 значения. Хорошо работает на абстрактных образах:
brain with neural network and chips white background,orange colors --w {0,250,500,1000}
3. Используем Zoom
Одно из дополнений в версии 5.2 - возможность дорисовки изображения. Midjourney отдаляет объект и дорисовывает картину рядом.
Можно нажать просто Zoom - тогда будет использован ваш первоначальный промт, если нажать Custom Zoom - то можно внести дополнения, что вы хотите видеть
Если задумка изображения вам понравилась, то можно попытаться дорисовать. Вот что получить при Zoom 2x
4. Используем дорисовку по сторонам
Midjourney в целом неплохо рисует центральный объект, но появляются трудности когда нам нужна композиция - несколько детальных объектов в изображении. У нас появляются "стрелочки" которыми мы указываем в какой области лучше дорисовать изображение. Так можно сделать и панорамные изображения.
Дорисуем наше изображение:
Это хороший способ когда нужно сделать изображение с несколькими сценами. Промт,к сожалению, менять нельзя, поэтому полагаемся на хорошее настроение Midjourney
5. Используем референс картинку
Если первые способы нас не удовлетворили во всех вариациях, или вы видите что совсем не в ту сторону думает MJ - есть способ направить его на путь истинный - показать фото или картинку как мы хотим.
Я хотел получить тех самых бабушек возле подъезда. Но по простому промту MJ мне выдавал их возле деревенского домика (по его мнению все бабушки в СССР жили только в избе)
Но есть простой способ - находим в интернете картинку-образ, благо по запросу "бабушки возле подъезда" мы получаем обилие ностальгических снимков. Далее копируем URL на неё и вставляем в начало промта (это важно, картинка должна идти первой). Получается так:
https://s.mj.run/qkbMDN9l_Ek Russian grandmothers near the Soviet entrance hall
Так можно обходить и некоторые темы с национальностями, их MJ не любит, только через референс я смог сделать цыган с медведями в танце.
6. Распознание изображений
Уже достаточно давно по меркам нейросетей MJ ввёл функцию /describe - по ней он даёт 4 промта, как он увидел то,что на картинке.
Полезная функция когда вы понимаете образ, который легко найти в интернете. Я этот метод часто использую когда нужно нарисовать здание, улицы, город и т.д.
И у нас есть отличная новая кнопка "Imagine all" - мы сразу получаем генерации по всем промтам - 4х4 изображений. Он не сможет нарисовать по описанию 1в1, но образ и стилистика часто будут сохранены, плюс он будет добавлять немного новизны, иногда его изменения очень полезны.
7. Просим помощи у ChatGPT
Промт - это текст, текст - это ChatGPT. В целом логика такая)
ChatGPT не знает всех тонкостей и новых функций MJ но он полезен чтобы описать сцену достаточно подробно. Вот он то пишет те самые длиииииинные промты.
Есть несколько методов написания промтов через ChatGPT - длинный и более верный, и короткий - когда время важнее художественности
Длинный. Так как ChatGPT не знает тонкостей MJ мы должны его дообучить. Мы даём ему описание, все функции в текстовом формате, показываем примеры промтов. Это более правильный метод с дообучением, но он занимает время и требует подготовки
Короткий. Используем базы плагинов или разрешения куда это уже вшито. Я использую AIPRM - это расширение для Chrome,в котором вы можете выбрать из пользовательской базы промт и просто ввести свою тему. У вас появляется такое окно, и в нём выбираем:Topic - Generative AI, Activity - Midjourney ,Ouput - English .И далее вводим описание что вам нужно.
Мне нужно было завтрак в стиле Алисы в стране чудес с множеством персонажей, вот какой промт я получил:
Create an image that depicts a scene from "Alice Through the Looking Glass" where Alice and several other characters are having breakfast in a mirrored room. The characters should be dressed in formal business attire, such as suits, dresses, and blazers. The setting should convey an elegant and sophisticated atmosphere, with a table adorned with a variety of breakfast items like pastries, fruits, and hot beverages. The characters can be engaged in conversation, enjoying their meal, or simply engaged in their own activities. The mirror should reflect the characters and the room, adding a sense of depth and surrealism to the image. The lighting should be soft and warm, casting gentle shadows and highlighting the details of the characters' expressions and clothing, white background
Добавляем параметр --ar чтобы задать нужный размер и получаем очень даже художественную картину:
8. Сокращаем промты с помощью самого Midjourney
А теперь повернём ситуацию с ансамблем нейронок в другую сторону. Свежая функция Midjourney /shortnen - она анализирует ваш промт, показывает слова которые она считает шумом, и предлагает 5, с её точки зрения, годных промта.
Проанализируем промт от chatgpt:
Он даёт 5 промтов, от более длинного, к более короткому.
НО! Он игнорирует соотношение сторон из начального промта, просто стоит это не забывать, и при генерации в каждый дописать.
Вот что вышло у MJ по промтам "проверенных лично":
В этом способе он предлагает сразу 5 вариантов - значит мы получим 20 изображений за 1 клик.
9. Используем библиотеку стилей
Midjourney обучен на миллионах фотографий и изображений разных стилей, и они были размечены разными тегами. Точной документации нету про все стили, но есть прекрасные люди которые исследуют и публикуют найденные стили. Низкий Вам поклон!
Один из примеров обширной библиотеки стилей:
Как это работает?
Смотрим базу и выбираем стиль, который нам понравился.
Нажимаем на название стиля под изображением, он сразу копируется в буфер обмена
Добавляем в конце промта этот стиль. Формат: (ваш промт),стиль --параметры
Вот несколько моих любимых :
10. Ищем вдохновения в сообществе
По правилам Midjourney, если вы используете подписку за 30 USD - то все ваши работы публичные. И на них можно взглянуть "одним глазком". Вот тут публикуются все работы.
Как мы можем использовать это этично и "во благо"?
-
Найти идею. Меня пригласили на вебинар с названием "toolbox маркетолога" - и с ходу что-то не было идей какую сделать картинку для анонса. И я просто ввёл "toolbox" и сразу нашёл несколько направлений и идей что можно сделать. По каждой картинке вам показывает промт, и все характеристики
-
Смотрим похожие работы. Если пролистать ниже, то MJ показывает похожие работы - главное уметь остановиться) Находим что ещё понравилось и снова в круг сансары
Анализируем свою работу. После Upscale у вас появляется кнопочка WEB и она ведет вас на вашу публичную работу, где ниже будут подобраны референсы, как выше.
Вдохновляемся. Один из важных аспектов генерации изображений - это насмотренность. 5-10 минут в день можно созерцать чудесные творения - анализировать промт, сохранять в фавориты.
Надеюсь мои советы помогут кому-то сэкономить пару часов времени на действительно важные дела. Я не умаляю трудов нейрохудожников - над хорошим изображением надо потрудиться несколько часов. Я рассказал свой опыт когда за пару часов надо сделать сотню изображений образов нужного качества.
Комментарии (4)
Keroro
12.07.2023 19:54+1Не "тайный завтра" а "тайная вечеря" наверное?
atsyhan_minsk Автор
12.07.2023 19:54Спасибо, поправил "тайный завтрак" - именно получился. В промте был breakfast - я просил сделать завтрак, а сам mj воспринял промт от chatgpt по аналогии с "тайная вечеря".
visirok
Спасибо. Очень интересно!
atsyhan_minsk Автор
надеюсь пригодиться в работе!