Ремарочка: это не туториал, а просто подробный разбор процесса.
Допустим, моя задача — генерация “фотосессии“ с разными людьми в разных ситуациях. Например, мать обнимает ребёнка и держит в руках пасхальное яйцо. Обстановка домашняя, светлая.
С чего начинаю?
С разбора ТЗ и похода в ChatGPT за промптами. Потом в Midjourney — там генерирую серию картинок в едином стиле, с разными людьми и сюжетами. Минимум 30 штук: бегущие дети, объятия и т. д. — чтобы потом собрать из них датасет.
Дальше отбираю удачные варианты: смотрю на ракурс, образы, цвета и текстуры.
После этого загружаю картинки в Krea для тренировки стиля. Таким образом я получаю:
- стиль Midjourney,
- анатомию Flux,
- удобное управление промптом во Flux.
Krea позволяет работать с разными моделями, но тренировка лоры и генерация в стиле этой лоры происходят именно на Flux.
Теперь могу сгенерировать нужный сюжет сразу в баннерном разрешении 16:9. Для начала покажу картинку без стиля:
А вот с настроенным стилем:
Так создаю целую серию. Если работаю с брендом, уточняю для ChatGPT, какие нужны сцены, цвета, одежда, интерьеры, и получаю пул промптов для генерации.
Далее первичная ретушь. Мне нравится глубина на этом кадре из-за цветка на переднем плане, но он будет мешать тексту. Вообще, здесь мало места под текст, так что надо сделать аутпейнт (расширение картинки с догенерацией, см. мой нейрословарь).
Апскейл. Можно провести только в Магнифике (х4, иногда х8), но если исходник слабый, например, мелкие фигуры людей вдали, то Магнифик внесет много своей анатомии. В таких случаях сначала делаю предварительный апскейл во Flux на компе — получится мыльновато, но поправится анатомия и общие черты персонажей.
Вот яркий пример косяков — после Magnific у свитера появились артефакты, а лицо ребёнка порядком состарилось:
Но допустим клиент выбрал именно это фото под большой баннер. Тогда маме надо распахнуть глаза, чтобы она смотрела на дочь + её взгляд будет условно направлен в сторону пустой зоны, зоны текста. Ну и конечно, девочку снова нужно сделать девочкой. Чтобы всё это провернуть, иду в Фотошоп, отрезаю от изображения кусок с “неправильным“ участком и инпейнчу его в Идеограм или Флакс.
Фотошопный инпейнт использую редко — он больше подходит для удаления мелких деталей. Картинку режу на части, иначе либо комп не потянет, либо Ideogram выдаст маленькую мутную версию (в зависимости от того, где редачу картинку).
Итак, в случае с лицами и свитером получаем это:
Такие же манипуляции проделываю с руками, ногами, одеждой и т.д. для этого и других изображений. Ну а после их можно ставить на большие баннеры с кайфом:
Если вы знаете локальный апскейл, который бы давал такую же классную резкость и текстуру как Магнифик, напишите об этом в комментариях. И подписывайтесь на мой канал, где я рассказываю о работе дизайнера с нейросетями.
Nunter
Солнышко, ты на каком сейчас языке разговариваешь?
85GB Автор
на нейросетевом, очевидно же)