Прежде, чем мы начнём наш обзор, кратенько обозначим, что ваще такое Омни-реф. Он же Omni-reference или --oref. Это относительно новая функция Миджорни, которая позволяет помещать ваш объект в создаваемые вами же генерации по промпту. Она может работать с персонажами, предметами, транспортом или разными существами. Сила референса регулируется с помощью ползунка или настройки --ow от 100 до 1000.

Давайте рассмотрим то, как работает новая функция Миджорни со своей генерацией и с внешней фоткой. У меня была теория, что он хорошо держит только «свои» лица и в редких случаях сторонние. Цифры настроек я меняла как по гайдам, так и по зову души.

Содержание

  1. Генерация персонажей
    1.1 Простая генерация, крупный портрет

  2. Добавляем приколюх

  3. Полный рост, смена одежды

  4. А что по вещам по вещичкам?

  5. А выход-то какой? И куда?

Генерация персонажей

Наблюдая множество… довольно расистских постов, я поняла, что для людей все азиаты на одно лицо, поэтому «Миджа великолепно держит персонажа», хотя одна явно Ю Джин Хок, вторая — Ли Шень, а третья — Назарбаева Жулдыз Талгатовна.

Поэтому я сгенерировала в Мидже и в Крее по одному персонажу с отличительными чертами. В первом случае — веснушки и курносый нос — классика Миджорни.

Во втором — выраженные скулы, мясистый кончик носа и слегка оттопыренные уши. Не самые выраженные признаки, но тем лучше и человечнее генерация. Ваще как живая.

Простая генерация, крупный портрет

В каждом случае, увы, параметр --ow подбирается индивидуально. Для фотографий может подойди 100 +-, а вот для генераций можно смело писать 300 и более. У девчонок ниже как раз 300, особой разницы с  «и более» нет.

Как можно заметить, из Миджорни в Миджорни лицо перетекло замечтательно, а вот из Креа в Миджи — другой человек (какую-то актрису мне напомнила). 

Добавляем приколюх

в виде мудбордов. Мудборды — это стили для изображений, которые тренируются юзером в Миджорни по одной или нескольким фотографиям. Своего рода LoRA, но попроще.

А что такое LoRA, токены, датасет и многое другое вы можете узнать в бесплатном нейрословаре на моём сайте.

Итак, промпт тот же самый, но с добавлением мудборда:

Про вторую кто-нибудь скажет: да они же одинаковые, какая разница. Я отвечу: теперь понятно, откуда так много шуток про отцов, забирающих из детсада чужих детей.

Тут такой нюансик есть, что разные мудборды могут по-разному влиять на качество изображения и на передачу лица, но тенденция «своя похожа, а чужая непохожа» всё равно сохраняется. К тому же, если нужно определённое лицо в определённой колористике, можно мрачно обломаться. Давайте я вам заодно покажу, как по-разному Миджа отрабатывает мудборды:

В случае с брюнеткой два разных мудборда по колористике почти идентичны, видимо, из-за особенностей «своей» девчонки, а в случае с блондинкой — кто в лес, кто по дрова. И картинки у блондинки очевидно отличаются от картинок брюнетки, хотя мудборды одни и те же (смотреть на название в настройках, Sunny и Woman on yacht).

Полный рост, смена одежды

Сугубо для полноты картины:

В этом сочетании мудборд + промпт удалось добиться наилучшего результата по блондинке, из 4-х хотя бы один вариант был похож. Что неадекватно для реального ТЗ реального заказчика.

Общие проблемы для всех вышеуказанных случаев:

  1. Применяется своего рода перехдр, часто лицо как бы «выпрыгивает», как будто она бахнула фейстюна на все деньги. Особенно заметно на «своей» девчонке.

  2. Пришлось применять персонализацию (мудборд), тогда лицо «выпрыгивает» меньше.

  3. Если применять больше 1-го мудборда, лицо «держать» перестаёт.

  4. Вовсе не проблема: анатомия. Я просто упомяну, чтобы вы не расслаблялись. Потому что её нет.

А что по вещам по вещичкам?

Зная, как Миджорни любит люкс, я не постеснялась взять с Фарфетча бархатную сумочку Chloe. И столкнулась с базовым траблом. НЕЛЬЗЯ ПРИМЕНИТЬ НЕСКОЛЬКО ОМНИ-РЕФОВ. Нельзя взять конкретную модель, нарядить её в конкретное платье и сунуть в руку конкретную сумку за 1 заход, чем, например, хвастаются видеоредакторы. Сколько придётся совершить заходов в Миджорни для такого действа я хз. 

Коллеги советовали по-костылински сделать коллаж, и я решила протестировать это. Попросила у GPT описать сумочку поподробнее, чтобы запихать её в промпт.

Это лучший вариант из получившихся. Девушка сменила расу, а сумка приобрела некую потасканность и явно лишние цепочки. На бляшку с лого можно даже глаза закрыть, не она тут правит бал.

Ну и давайте просто попробуем эту сумку заомнирефить без девушки:

А теперь давайте посмотрим, как справляется Flux Kontext:

Как говорится, слова излишни. Уточню, что это известная для Миджорни сумка, она генерирует её без рефов самостоятельно. Далеко не 1в1, но казалось, что Омни-то должен прям скопировать на 100%. И вот как выглядит чистый ген, без Омни:

А выход-то какой? И куда?

Всё зависит от целей. Есть разные сервисы-переодеваторы или Flux kontext, также можно использовать Kling, Runway. Это для быстренького и дешёвого переодевания с потерей в качестве материала. Ну и комбинация инструментов, конечно же. Например, Midjourney + Ideogram. Потому что у Миджорни лучше композиция, а в Идеограме прекрасный инпейнт и вклейка объектов. А ещё потому, что Омниреф влияет на стиль генерации. 

Разберём на примере скраба для тела локального российского бренда:

Далее:

1 Фото — генерация в Миджорни по промпту.
2 Фото — генерация в Миджорни по тому же промпту + Омниреф.Как можно заметить, Омни портит композицию, удешевляет её, будто бы каменную плиту слямзили с ближайшей стройки.

И здесь нам поможет Идеограм. С помощью промпта можно управлять баночкой, делать её как открытой, так и закрытой, например. Надписи, увы, придётся дорабатывать Фотошопом.

Кампейн продукта можно разработать с помощью Флакс контекст, а одежды — с помощью него же и тренировки Лоры. Персонаж + одежда + аксессуар — 3 Лоры + доработка в ФШ или долгая работа с помощью Флакс Контекст и Идеограм, или Клинг, или… вариантов масса, всё зависит от бюджета и целей. Чем больше проект — тем больше комбинаций.

Можно на постоянке юзать миджелица, потому что их Миджорни удерживает намного лучше. Хотя, признаюсь, меня от этих фейсов подташнивает ровно так же, как и от стандартных флаксовских. Хочется всё же больше жизни и разнообразия вместо ртов на пол лица. Но тут, опять же, всё зависит от бюджета и целей.

Так что помолиться на очередной новый инструмент, который лучше всех на свете опять не вышло, и всё ещё нужно использовать комбинацию из кучи инструментов. Надеюсь, данный обзор был для вас полезным и интересным. Нейрофотосеты, использование Креи в реальной работе и многое другое мы с подпищщиками обсуждаем в моём ТГ-канале. Там много советов, инсайтов и лайфстайла из работы дизайнера с нейросетями.

Комментарии (0)