Ремарочка: это не туториал, а просто подробный разбор процесса.

Допустим, моя задача — генерация “фотосессии“ с разными людьми в разных ситуациях. Например, мать обнимает ребёнка и держит в руках пасхальное яйцо. Обстановка домашняя, светлая.

С чего начинаю?

С разбора ТЗ и похода в ChatGPT за промптами. Потом в Midjourney — там генерирую серию картинок в едином стиле, с разными людьми и сюжетами. Минимум 30 штук: бегущие дети, объятия и т. д. — чтобы потом собрать из них датасет.

Дальше отбираю удачные варианты: смотрю на ракурс, образы, цвета и текстуры.

После этого загружаю картинки в Krea для тренировки стиля. Таким образом я получаю:

- стиль Midjourney,
- анатомию Flux,
- удобное управление промптом во Flux.

Krea позволяет работать с разными моделями, но тренировка лоры и генерация в стиле этой лоры происходят именно на Flux.

Теперь могу сгенерировать нужный сюжет сразу в баннерном разрешении 16:9. Для начала покажу картинку без стиля:

А вот с настроенным стилем:

Так создаю целую серию. Если работаю с брендом, уточняю для ChatGPT, какие нужны сцены, цвета, одежда, интерьеры, и получаю пул промптов для генерации.

Далее первичная ретушь. Мне нравится глубина на этом кадре из-за цветка на переднем плане, но он будет мешать тексту. Вообще, здесь мало места под текст, так что надо сделать аутпейнт (расширение картинки с догенерацией, см. мой нейрословарь).

Апскейл. Можно провести только в Магнифике (х4, иногда х8), но если исходник слабый, например, мелкие фигуры людей вдали, то Магнифик внесет много своей анатомии. В таких случаях сначала делаю предварительный апскейл во Flux на компе — получится мыльновато, но поправится анатомия и общие черты персонажей.

Вот яркий пример косяков — после Magnific у свитера появились артефакты, а лицо ребёнка порядком состарилось:

Но допустим клиент выбрал именно это фото под большой баннер. Тогда маме надо распахнуть глаза, чтобы она смотрела на дочь + её взгляд будет условно направлен в сторону пустой зоны, зоны текста. Ну и конечно, девочку снова нужно сделать девочкой. Чтобы всё это провернуть, иду в Фотошоп, отрезаю от изображения кусок с “неправильным“ участком и инпейнчу его в Идеограм или Флакс.

Фотошопный инпейнт использую редко — он больше подходит для удаления мелких деталей. Картинку режу на части, иначе либо комп не потянет, либо Ideogram выдаст маленькую мутную версию (в зависимости от того, где редачу картинку).

Итак, в случае с лицами и свитером получаем это:

Такие же манипуляции проделываю с руками, ногами, одеждой и т.д. для этого и других изображений. Ну а после их можно ставить на большие баннеры с кайфом:

Если вы знаете локальный апскейл, который бы давал такую же классную резкость и текстуру как Магнифик, напишите об этом в комментариях. И подписывайтесь на мой канал, где я рассказываю о работе дизайнера с нейросетями.

Комментарии (21)


  1. Nunter
    04.02.2025 20:08

    Солнышко, ты на каком сейчас языке разговариваешь?


    1. 85GB Автор
      04.02.2025 20:08

      на нейросетевом, очевидно же)