Хочется больше внимания уделить стилям изображений и продемонстрировать их различия на ярких примерах. Взяла 4 нейронки: Flux, Ideogram, Visual Electric и конечно же Midjourney. Чтобы никто не отвлекался на лица, в промпте указала, что девушка бежит спиной к зрителю. Отправной точкой в нашем сравнении будет картинка из Флакса.

Идеограм (пикча ниже) позволяет ремиксить в нём картинку-оригинал вплоть до 100 процентов смешения. При этом даже на 100%, разумеется, меняется цветовой, светотеневой рисунки и анатомия.

Для наглядности я смешала на 80%, чтобы было чётко видно различие в стилях.

  1. И возможно не самое явное отличие — увеличение деталей и шероховатости изображения. Мыльный Флакс превращается в детализированную картинку.

  2. То, что сразу и явно бросается в глаза — потеря насыщенности.

  3. И не самое очевидное — изображение становится более плоским. Старички знают, что для оценки светотеневого рисунка, надо перевести фото в чб (щас такому на энтих вашенских курсах не учут). Таким образом мы можем увидеть потерю глубины и объёма:

  4. А если приблизим картинку, то увидим, что детали-то как раз потерялись, теневые участки попросту "выбиты", информация в них потеряна и такие участки без перегенерации восстановить невозможно:

А сейчас придётся сделать небольшое отступление. Так ремиксят ту же самую картинку Вижуал Электрик и Миджорни:

И так как Вижуал Электрик почти потерял свой стилёк при ремиксе картинки, а Миджорни… я даже хз как объяснить то, что он сделал, проведём сравнение на промпте. Выбрала варианты с блондами, так будет более наглядно.

  1. На этой картинке яркая демонстрация по-настоящему высокой контрастности и насыщенности. Кстати говоря, в чб такая пикча смотрится лучше остальных, но есть свои нюансы. Например, фон с деревьями сильно темнее и контрастнее девушки, что делает его как будто бы резче. И это, к слову, одна из причин, почему в цветном варианте изображение выглядит "вырвиглазно".

  1. А вот в случае с Миджи можно сказать, что достигнут идеальный баланс. Спасибо нейробогу, что мы не видим девушку ниже грудного отдела, а то можно было бы разочароваться. Но по цветам, текстуре, светотеневому рисунку и воздушной перспективе это эталон художественной фотографии. Такие картинки легко идут на баннеры и блоги путешествий. А вот "фотография" с Вижуал Электрик явно больше подойдёт для новости о каких-нибудь спортивных соревах.

Ну и завершила всё общими раскладками для наглядной демонстрации.

Задавайте вопросы, дополняйте комментариями, а при большом желании можете подписаться на мой ТГ-канал, где я рассказываю о работе дизайнера с нейросетями и не только.

Комментарии (7)


  1. numark
    06.02.2025 17:05

    "шероховатости". вы на пальцы посмотрите на некоторых фото :))


    1. 85GB Автор
      06.02.2025 17:05

      так я ж про общий визуал пишу, про редактирование деталей писала в этой статье


  1. Ilya_JOATMON
    06.02.2025 17:05

    От "визуала" сгенерированных ИИ КДПВ на хабре уже блевать тянет. Пожалуста, не занимайтесь созданием еще гор треша, и так его выше крыши.


    1. 85GB Автор
      06.02.2025 17:05

      да, надо организовать антииишный протест, это определённо поможет)


  1. 4external
    06.02.2025 17:05

    А вывод какой? :)
    Ну, кроме того, что в ТГ нужно заглянуть? :)


    1. 85GB Автор
      06.02.2025 17:05

      Вывод — каждый пользуется понравившимся инструментом, а я показываю, чем они отличаются)


      1. 4external
        06.02.2025 17:05

        Извините, потом увидел в пункте 2, что мидж №1.