Хочется больше внимания уделить стилям изображений и продемонстрировать их различия на ярких примерах. Взяла 4 нейронки: Flux, Ideogram, Visual Electric и конечно же Midjourney. Чтобы никто не отвлекался на лица, в промпте указала, что девушка бежит спиной к зрителю. Отправной точкой в нашем сравнении будет картинка из Флакса.
![](https://habrastorage.org/getpro/habr/upload_files/df8/3c8/163/df83c81634f858156a454c07fdd8f834.png)
Идеограм (пикча ниже) позволяет ремиксить в нём картинку-оригинал вплоть до 100 процентов смешения. При этом даже на 100%, разумеется, меняется цветовой, светотеневой рисунки и анатомия.
Для наглядности я смешала на 80%, чтобы было чётко видно различие в стилях.
![](https://habrastorage.org/getpro/habr/upload_files/351/53a/200/35153a20033df5995a89e0fde925a417.png)
И возможно не самое явное отличие — увеличение деталей и шероховатости изображения. Мыльный Флакс превращается в детализированную картинку.
То, что сразу и явно бросается в глаза — потеря насыщенности.
-
И не самое очевидное — изображение становится более плоским. Старички знают, что для оценки светотеневого рисунка, надо перевести фото в чб (щас такому на энтих вашенских курсах не учут). Таким образом мы можем увидеть потерю глубины и объёма:
А если приблизим картинку, то увидим, что детали-то как раз потерялись, теневые участки попросту "выбиты", информация в них потеряна и такие участки без перегенерации восстановить невозможно:
![](https://habrastorage.org/getpro/habr/upload_files/093/877/f1e/093877f1e96440441a77657e88361d74.png)
![](https://habrastorage.org/getpro/habr/upload_files/9f6/a18/38a/9f6a1838ac1d4e0d54ed3cb8d27985e7.png)
А сейчас придётся сделать небольшое отступление. Так ремиксят ту же самую картинку Вижуал Электрик и Миджорни:
![](https://habrastorage.org/getpro/habr/upload_files/2c4/491/2bd/2c44912bd150c79703e201e73c1bb63f.png)
![](https://habrastorage.org/getpro/habr/upload_files/923/ef2/e06/923ef2e065cd2e11f8d2d8cf3e85381b.png)
И так как Вижуал Электрик почти потерял свой стилёк при ремиксе картинки, а Миджорни… я даже хз как объяснить то, что он сделал, проведём сравнение на промпте. Выбрала варианты с блондами, так будет более наглядно.
![](https://habrastorage.org/getpro/habr/upload_files/86e/acd/c80/86eacdc80735e6ba9b5f2ab0ad1ac3c4.png)
На этой картинке яркая демонстрация по-настоящему высокой контрастности и насыщенности. Кстати говоря, в чб такая пикча смотрится лучше остальных, но есть свои нюансы. Например, фон с деревьями сильно темнее и контрастнее девушки, что делает его как будто бы резче. И это, к слову, одна из причин, почему в цветном варианте изображение выглядит "вырвиглазно".
![](https://habrastorage.org/getpro/habr/upload_files/8dc/8b4/57d/8dc8b457d9fa63ec8a32182cece21ab5.png)
А вот в случае с Миджи можно сказать, что достигнут идеальный баланс. Спасибо нейробогу, что мы не видим девушку ниже грудного отдела, а то можно было бы разочароваться. Но по цветам, текстуре, светотеневому рисунку и воздушной перспективе это эталон художественной фотографии. Такие картинки легко идут на баннеры и блоги путешествий. А вот "фотография" с Вижуал Электрик явно больше подойдёт для новости о каких-нибудь спортивных соревах.
![](https://habrastorage.org/getpro/habr/upload_files/abf/70e/ba1/abf70eba16297ee00ea89215a800ccc4.png)
![](https://habrastorage.org/getpro/habr/upload_files/13c/121/c40/13c121c405f159c8a73d2d2200fde750.png)
Ну и завершила всё общими раскладками для наглядной демонстрации.
![](https://habrastorage.org/getpro/habr/upload_files/a4a/70d/b03/a4a70db03ad06029f02d1afd8f9a3ad3.png)
![](https://habrastorage.org/getpro/habr/upload_files/8e8/b72/fe2/8e8b72fe26f28e3bede52512d6c1c514.png)
![](https://habrastorage.org/getpro/habr/upload_files/2f7/9f3/e2b/2f79f3e2b09ba538a84d53a3e317c6ee.png)
Задавайте вопросы, дополняйте комментариями, а при большом желании можете подписаться на мой ТГ-канал, где я рассказываю о работе дизайнера с нейросетями и не только.
Комментарии (7)
Ilya_JOATMON
06.02.2025 17:05От "визуала" сгенерированных ИИ КДПВ на хабре уже блевать тянет. Пожалуста, не занимайтесь созданием еще гор треша, и так его выше крыши.
numark
"шероховатости". вы на пальцы посмотрите на некоторых фото :))
85GB Автор
так я ж про общий визуал пишу, про редактирование деталей писала в этой статье