Эту историю для моего блога рассказал профессиональный фотограф Олег Цербаев

В начале 2000-х появилась цифровая фотография, мир раскололся на два лагеря: «Это не искусство!» против «Это будущее!». За три года в рекламной индустрии почти не осталось фотографов старше 40 лет. Крупные журналы начали работать с молодыми ребятами, фотоиндустрия в итоге выросла в разы. То, что происходит сейчас с нейросетями — намного масштабнее. Это не просто новый инструмент в нашем арсенале, а целая новая реальность.

Представьте, что вместо кисти художнику вдруг дали соавтора — талантливого, с безграничной фантазией, но иногда непредсказуемого. Именно так работают нейросети в создании изображений. Они не просто выполняют команды — они интерпретируют, дополняют и иногда удивляют.

Сотрудничество с нейросетью похоже на работу с очень талантливым и немножко пьяным автором

Чарли Энгман, фотограф

Вместо страха перед новыми технологиями я предлагаю взглянуть на них как на инструмент расширения творческих возможностей. Ведь в конце концов, хорошая фотография — это не только технология, но и взгляд автора.

Давайте разберемся, как использовать нейросети в фотографии по шагам.

1. Выбор подходящей нейросети: мой соавтор

Начинаю всегда с выбора правильного "соавтора". Каждая нейросеть имеет свой характер и таланты, которые определяют всю дальнейшую работу.

Midjourney — мой основной партнер для творческих проектов. Он обладает феноменальным художественным чутьем и понимает композицию, цвет и свет на удивительно глубоком уровне. Главное преимущество — потрясающе большой контекст. Он знает фотографические техники, понимает, что такое мультиэкспозиция или передний и задний свет, узнает стили разных фотографов. Выбираю его, когда нужны эмоциональные, атмосферные фотографии с глубиной и характером.

Chat GPT-o (Dall-E) — идеальный партнер для точных задач. Он изумительно понимает промпты и добавляет только то, что я запрашиваю — в этом его сила и одновременно ограничение. К сожалению, с фотореализмом у него пока не всё гладко. Обращаюсь к нему, когда критично точное следование описанию без творческих "отклонений".

Adobe Firefly — незаменимый помощник на финальных этапах. Он великолепно достраивает и увеличивает изображения. Лучший вариант для ретуши, хотя создание контента с нуля или изменение деталей внутри изображения (inpainting) делает не так хорошо. Использую его для финальной доработки уже имеющихся изображений.

Krea — специалист по лицам и персонажам. Позволяет обучить модель работать с конкретными лицами. Обращаюсь к нему для доработки и управления персонажами.

Со временем я понял, что ограничиваться одной нейросетью — неразумно. В своей практике часто использую Midjourney для создания базовой концепции и атмосферы, потом применяю инструменты Krea для работы с персонажами, а финальную доработку делаю с помощью Adobe Firefly или редактора в Midjourney.

На старте Midjourney дает больше свободы и креативности, но если понимать логику Sora и правильно выстраивать диалог с ней — управляемость у Sora оказывается выше и результаты интереснее.

2. Стилизация и персонализация: уходим от шаблонов

Перед началом работы определяюсь со стилем и общей эстетикой. Это как выбор фотографического языка перед съемкой — он задает все направление работы.

Многие начинающие пользователи жалуются, что их генерации "слишком похожи на Midjourney". И это понятно — без понимания принципов персонализации все изображения получаются с характерным "нейросетевым привкусом", легко узнаваемым даже неопытным глазом.

Сила Midjourney — в фантастической глубине контекста и знании истории искусства, фотографии, кино и театра. Он знает стили, художников и умеет подбирать визуальные референсы. Но чтобы этой силой управлять, нужно задать конкретное направление.

В Midjourney отлично работает функция создания мудбордов и управления стилями. С помощью нее я формирую несколько авторских стилей, которые потом могу включать/выключать, усиливать или ослаблять.

Мой процесс работы выглядит так:

  1. Формирую мудборд под конкретную задачу

  2. Регулирую мощность его влияния на генерацию

  3. Переношу стиль на новые изображения

Мудборд:

Генерация:

Интересно, что нейросеть вычитывает не просто цвет и свет, а общий "вайб" мудборда. Например, если собрал мудборд из фэшн-фотографий — результат будет с фэшн-эстетикой, если из трагичных сцен — генерация получится драматичной.

3. Создание первичного промпта: диалог, а не программирование

Промпт для меня — это не программирование, а скорее разговор с талантливым, но иногда своенравным ассистентом.

В своих промптах я придерживаюсь трех принципов:

Избегаю чрезмерно длинных описаний. Нейросети путаются в длинных, противоречивых текстах. Чем длиннее промпт, тем больше шанс, что одна его часть будет противоречить другой.

Использую конкретику вместо абстракций. Нейросети плохо понимают общие термины вроде «фотореалистичный» или «кинематографичный». Для нейросети эти слова — сигнал, что она может делать что хочет. Вместо них я даю конкретные описания света, ракурса, фактуры.

Делаю акцент на визуальных ориентирах. Указываю конкретные визуальные элементы: тип освещения, цветовую гамму, композицию, материалы и фактуры.

А вот как я улучшаю свои промпты с помощью ChatGPT:

Часто начинаю с базового промпта:

homeless man, in his 60s, sick and degraded, harsh light, very HDR, close up, smoking cigarette, angry walk on the street extremely long shutter speed, motion blur ::2

Затем иду в ChatGPT и прошу: "Задай мне вопросы, необходимые для того, чтобы понять, что я хочу получить". Отвечаю на вопросы и прошу создать короткий емкий промпт для Midjourney.

После такой доработки промпт выглядит уже гораздо лучше:

homeless man, in his 60s, sick and vulnerable, harsh sunlight, cold tones, highly detailed skin textures, wrinkles, dirt, smoking cigarette, motion blur from walking, busy New York street, documentary style, slight dynamic blur, realistic HDR

Если мне нужно изменить настроение, я прошу Chat GPT переделать промпт и сделать картинку более естественной на общем плане, более документальной и похожей на стиль 80-х:

1980s New York street, elderly homeless man walking, worn clothes, tired and vulnerable expression, natural sunlight casting soft shadows, slight motion blur from movement, vintage film grain, muted cold tones, medium wide shot, authentic documentary style

Особенно внимательно в промте отношусь к описанию света. Свет — это душа фотографии, даже сгенерированной. Именно он чаще всего отличает профессиональное изображение от любительского.

Чтобы получить действительно живую картинку, объясняю нейросети, что мне нужно, через конкретные визуальные инструменты. Но для этого важно самому понимать, как возникает фотореалистичное изображение — быть немного фотографом.

В промтах:

  • Вместо "хороший свет" → "мягкий рассеянный свет из большого окна слева"

  • Вместо "драматичный свет" → "жесткий направленный свет сверху с синими тенями"

  • Вместо "вечерний свет" → "теплый закатный свет, создающий длинные янтарные тени"

Пример промпта со светом:

Cool moonlight from the window falls on to an elderly man sitting at a table in a train compartment, flowers on the table, HDR, film grain, 1980s photo style

(В переводе: холодный лунный свет из окна падает на пожилого мужчину, сидящего за столом в купе поезда, на столе цветы, HDR, зернистость пленки, фотостиль 1980-х)

Да, миджорней справился хорошо, но все-таки свет получился не лунный, а закатный
Да, миджорней справился хорошо, но все-таки свет получился не лунный, а закатный

4. Итерационный процесс: пошаговое улучшение

Работа в Midjourney строится по этапам. Промпт — это только стартовая точка, а дальше идет доработка текста, работа с вариациями и разными инструментами. Этот процесс похож на редактуру текста, где каждое действие может меняться или уточняться.

5. Финальная доработка: последние штрихи

На этом этапе уделяю внимание мелким деталям, которые отвлекают от основной идеи. Использую инструменты редактора для точечной корректировки:

  • Удаляю лишние элементы

  • Уточняю выражения лиц

  • Корректирую неестественные детали (особенно руки, часто проблемная зона для нейросетей)

В Midjourney v.7 значительно улучшилась функция ремикса. Теперь есть разделение на Subtle и Strong:

  • Subtle сохраняет композицию, но позволяет изменить детали

  • Strong может существенно изменить изображение, сохраняя общую идею

Добавил страшную куклу на колени
Добавил страшную куклу на колени

Для финальной доработки часто комбинирую различные нейросети:

  • Создаю базовое изображение в Midjourney

  • Улучшаю лица с помощью Krea

  • Провожу финальную постобработку в Adobe Firefly или Photoshop

И важный момент: не спешу удалять промежуточные результаты. Иногда вариация, которая казалась неудачной на раннем этапе, оказывается более интересной в контексте всей серии изображений.

Гибридная фотосъемка

Сейчас в своей работе я объединяю нейросеть и фотографию. Процесс гибридной фотосъемки в моей практике выглядит так:

Создаю концепт и генеративные изображения с учетом плана, среды и стиля заказчика

Экспериментирую с генерацией сцен. Меняю пропорции, цвета и вариации.
Экспериментирую с генерацией сцен. Меняю пропорции, цвета и вариации.

2. Провожу фотосъемку под уже готовые сгенерированные фото

3. Объединяю реальное фото, полученное в студии, с генеративным изображением

Делаю в фотошопе
Делаю в фотошопе

В результате получаются реалистичные, но в то же время сказочные фотографии. Этот подход позволяет сочетать контроль над моделью и деталями с возможностями нейросети в создании фантастических сред и эффектов.

Выводы

Я вижу, как фотография, изображения, видео перестают быть инструментами работы с реальностью и становятся инструментами работы с идеями.

Идея демократизации и доступности работы с изображением для всех — это то, что меня особенно вдохновляет. Сейчас возникла совсем другая точка входа в творчество. Не нужно годами учиться новым профессиям и осваивать сложные технические навыки.

У визуального языка нейросетей есть своя грамматика и синтаксис, и этот язык эволюционирует стремительно. То, что было революционным три месяца назад, сегодня может казаться устаревшим. Как в "Алисе в Зазеркалье": чтобы остаться на месте — надо бежать со всех ног, а чтобы продвинуться вперед — бежать еще быстрее.

Но в центре этого технологического потока остается неизменным главное — важность человеческого видения и творческого подхода. Нейросеть может создать тысячи изображений, но только человек способен наделить их смыслом и эмоциональной глубиной.

Я веду блог «А потом пришла нейросеть». Рассказываю, как люди используют нейросети в работе и жизни уже сегодня. Загляни в канал — там я собрала наглядную схему работы фотографа с нейросетями, которая поможет быстрее освоить AI-инструменты.  Подпишись, чтобы не пропустить новые статьи!

Комментарии (5)


  1. RomeoGolf
    20.05.2025 10:57

    У вас очень странные представления о таланте и фантазии, если вы называете нейросети талантливыми и обладающими фантазией...

    А главное - зачем? Генерировать тонны мусора для КДПВ? Этого бомжа, например, можно было фоткнуть на любой современный мобильник, просто выйдя из дома и прогулявшись минут 5 по улице (полагаю, каждый в своем городе знает правильные места для этого). Еще Татьяныч писал, что когда тебе нужен лист дерева, не надо рисовать его в фотошопе/иллюстраторе час, не надо рыться в стоках два часа, надо выйти на улицу, подобрать подходящий под ногами, вернуться и положить его в сканер, пару минут на все, и лист настоящий. И это касается 3/5 иллюстраций, которые от ИИ нифига не выигрывают.

    А такие тети в платье и болоте и нужны, чтобы показать, как фотограф умеет свет ставить. То есть, теперь они не нужны вовсе. Разве что для мемчиков. Раньше абстрактное фото - это был эксперимент, проверка, что можно из фотографии как таковой выжать еще, проверка на что способен фотограф. А теперь ценность этой фигни не больше, чем детсадовский рисунок карандашом - тоже фигня какая-то непонятная, тоже никто еще так не делал, только фотореалистично, но зачем?

    Что касается произведений искусства, то лично для меня художественное качество фото/картины (соответственно, талант автора) определяется тем, захочется ли мне регулярно смотреть на это, если оно будет, скажем, висеть на соседней стене, или оно будет столь же привлекательно для глаза, как обои, на которых висит. Так вот среди ИИ-поделий не видел ни одного изображения, которое хотелось бы повесить на стенку. Среди "живых" таких немало.

    С появлением фотомобильников найти приличное любительское фото стало практически нереально, тонет в мусоре. Теперь мусора станет не в разы, а на порядки больше. Но мне грустно не от того, что "раньше деревья были зеленее", а от того, что катастрофическое падение среднего уровня приведет к тому, что он и станет нормой, перестанет быть мусором. Уже перестает. Вместе с упрощением музыки, стихосложения, обесцвечиванием кино... Казалось бы - у людей в руках появились мощные инструменты, можно улучшить качество - ан нет, растет пока только количество, а стандарты качества подгоняются под то, что есть.


  1. farh-i
    20.05.2025 10:57

    .Все же впечатление, что нейросеть убивает душу живой фотографии. Это просто грубый автоматизированный фотошоп


  1. LinkToOS
    20.05.2025 10:57

    Фотограф запечатлевает на фотографии то, что реально существует в нашем мире. Когда смотришь на фотографию, то понимаешь что возможно находится в таком месте реально, наблюдать это вживую. Фотография это не просто красивая картинка, это отражение реального мира. Фотографии показывают какой наш мир в действительности.
    ИИ-контент переводит нас в мир виртуальный. Вымышленные сцены, вымышленные события. При этом ничего не мешает верить в то, что сгенерированную ИИ фотокомпозицию можно воссоздать в реальном мире. Вопрос лишь в том, насколько нам комфортно принимать вымысел как возможную реальность.

    Если искать в фотографиях чистую эстетику, то наверно нет разницы между реальной фотографией и синтезированной. Если через фотографии изучать реальный мир, то синтетика равносильна обману.

    Что касается ИИ-обработки реальных фотографий, с целью поиска идеального баланса по цвету и контрасту, то никакого криминала в этом нет. Но да, это девальвирует индивидуальные способности фотографа. Способность подобрать идеальные параметры съемки больше не будет считаться ценным умением.


  1. PerroSalchicha
    20.05.2025 10:57

    Сейчас возникла совсем другая точка входа в творчество. Не нужно годами учиться новым профессиям и осваивать сложные технические навыки.

    Да, только это означает, что сама по себе профессия исчезнет, превратится в забаву, доступную почти каждому желающему. Я вот не могу делать красивые фотографии. Может быть, мог бы, если бы учился, но я не учился. Но я без проблем могу щелкнуть как попало, а потом уговорить нейронку преобразовать это во что-то, выглядящее профессионально. По крайней мере, на взгляд неискушённого зрителя :)


  1. anonymous
    20.05.2025 10:57