Признайтесь, бывало так, что для поста или презентации нужна идеальная картинка, а в итоге вы тратите полвечера, перескакивая между стоками, редакторами и сомнительными PNG из Google? И всё равно выходит не то, что было в голове.

С появлением нейросетей этот круг ада можно смело вычеркивать. Теперь идея появляется сначала в голове, а через пару секунд уже на экране. Хотите бизона в короне, киберпанковскую библиотеку или фэнтези-кофемашину на паровом ходу? Никаких фотографов, художников и бесконечных правок, только текст и немного фантазии.

Кстати, видели обложку с Наполеоном, который скачет верхом на динозавре и размахивает саблей, пока флаг с черепом развивается у него за спиной? Да, это не отрывок из учебника альтернативной истории. Это пример того, как нейросети умеют превращать абсолютно безумные образы в настоящие картинки.

И раз уж мы начали с эпика, давайте не тормозить. Сегодня разберём, какие нейросети могут оживить нашего француза и как ими пользоваться, даже если вы никогда не открывали Photoshop.

Пристегивайтесь, будет интересно!


BotHub

С помощью BotHub можно протестировать популярные AI для генерации изображений. Внутри сервиса действует своя валюта - капсы. Над полем для ввода промпта можно выбрать нужную. В списке доступны Nano-BananaGemini-3-Pro-Image-Preview, FluxDall-e-3Midjourney-7, и Stable-Diffusion-3.

А при регистрации по этой ссылке Bothub дарит 100 000 капсов - забирайте бонус и начинайте творить бесплатно!

Для примера я выбрал генерацию изображения через Midjourney. А промпт везде будет один.

Промпт

PHOTO-REALISTIC EPIC SCENE: EARLY 19TH CENTURY FRENCH MILITARY EMPEROR IN FULL DRESS UNIFORM RIDING A HUGE TYRANNOSAURUS. HE WEARS A TRICORN HAT AND A RED CLOAK WITH A PIRATE FLAG (SKULL AND CROSSBONES). THE EMPEROR IS WELL LIT, WITH A DETAILED FACE, A STERN LOOK, REALISTIC FEATURES, AND SKIN TEXTURES. THE TYRANNOSAURUS LOOKS LIKE A LIVING PREDATOR WITH BULKY MUSCLES, TEXTURED SCALES, WETLY GLEAMING TEETH, AND POWERFUL PAWS. THE BACKGROUND INCLUDES MOUNTAINS, WIND, AND SAND, WITH A DRAMATIC LOW-HORIZON SUN; THE VISUAL STYLE RESEMBLES A CINEMATIC HISTORICAL FILM. THE IMAGE FEATURES HIGH SHARPNESS, VOLUME, DEPTH, 8K RESOLUTION, HIGH CONTRAST, AND NO TEXT.

Тестируем!

Кроме этого, вы можете выбрать одно из 11 разрешений для генерации, контролировать качество, причудливость, cтилизацию, хаос и прерывание.


Grok Imagine

Главная фишка - его интеграция в X. То есть прямо внутри соцсети вы можете написать промпт, и модель тут же выдаст результат, не покидая платформы. Он работает для всех пользователей X. А на один промпт вы получаете ленту, полную изображений, которые вы можете превратить в видео до 6 секунд!

Под капотом стоит Grok Imagine v0.9. Он создаёт фото, портреты, сложные сцены с архитектурой и текстурами. С кириллицей, как и у многих, у него бывают сложности, поэтому проще перейти на латиницу или максимально упростить запрос.

Тестируем!

Пока вы листаете вниз, появляются еще варианты. Grok Imagine сделал неплохие материалы, но половина из них не совпадает с запросом. В нашем случает нет пиратского флага за спиной, но картинка годная.

Интересно, что Grok Imagine поддерживает запросы на прорисовку дизайна приложения. Текст, конечно, будет кривоватым, но для идеи можно посмотреть.


GPT Image

Один из самых популярных сервисов для генерации картинок сегодня. Работает всё на базе DALL·E 3 прямо в приложении или на сайте СhatGPT.

Бесплатный тариф позволяет генерировать около 5-ти изображений в день. Картинки будут созданы без приоритета. Генерация может занять несколько секунд, а может и минут, но качество обычно высокое. Картинки создаются по текстовому запросу, также можно загрузить свою картинку или элементы, которые хотите видеть в результате, и попросить сервис работать с ними.

Тестируем!

Бесплатные инструменты работают в режиме «text‑to‑image» и «image‑to‑image / photo‑editing». По нашим наблюдениям, лучше всего заходят промпты, написанные на английском языке.


 Kling

В сервисе есть возможность генерировать как видео, так и картинки. Дополнительно можно загрузить референсное изображение, на которое нейросеть будет ориентироваться при генерации. Это необязательно, но повышает точность. Рядом с картинкой есть ползунок, который регулирует силу референса. Также можно выбрать соотношение сторон (доступно 8) и указать количество генераций (от 1 до 9 за раз).

В бесплатной версии пользователь получает 66 кредитов в день. Генерация одной картинки стоит 0,20 кредитов по текстовому промпту и 0,30 с дополнительным референсным изображением.

Тестируем!

В бесплатной версии пользователь получает 66 кредитов в день. Генерация одной картинки стоит 0,20 кредитов по текстовому промпту и 0,30 с дополнительным референсным изображением, но, к сожалению, итог будет с вотермаркой.


Nano Banana Pro

Перед вами открытая платформа для краудсорсингового бенчмаркинга моделей ИИ (LLM) — пользователи задают запросы, два анонимных модельных ответа сравниваются, и люди голосуют, какой ответ лучше. На основе этих голосов формируется рейтинг (лидерборд) моделей, что помогает видеть, как разные ИИ справляются с одним и тем же заданием.

Недавно LMArena добавила Nano Banana Pro в список доступных моделей, причём под названием gemini-3-pro-image-review(nano-banana-pro). Пользователи могут запускать генерацию в режимах Direct Chat или Side-by-Side и сравнивать результаты с другими моделями. Поддерживается как создание изображения по тексту, так и генерация на основе загруженных референсов.

Тестируем!

Единственный минус со стороны платформы заключается в отсутствии выбора разрешения и соотношения сторон, поэтому работы пока создаются в дефолтных настройках. Лимиты не объявлены, поэтому можно запускать до тех пор, пока сервис даёт.

Reve Image

Онлайн-редактор изображений, который объединил возможности текстовой генерации и визуального редактирования. Пользователь может загрузить свою картинку или указать текстовое описание, после чего сервис создаёт или перерабатывает изображение. Вы можете добавить объекты, изменить композицию, масштабировать элементы и применять стили.

Особое внимание вызвало и то, что в отличие от известных игроков вроде Adobe, у Reve заметно меньше фильтров и ограничений на генерацию. Это открывает пользователям больше свободы, но одновременно ставит вопросы о том, насколько такая система готова к широкому применению.

Ограничения есть в виде энергии. На бесплатном тарифе будут 2 палочки, на платном 5. А на выходе вы получаете выбор из 4-х фотографиях в разных позах.

Тестируем!

Также есть интересная функция Image Creator & Remixer, которая позволяет пересобирать изображения в реальном времени. Пользователь может перетаскивать объекты, изменять форму и позицию прямо мышкой, как в привычной программе-редакторе.


FLUX.2

Она поддерживает работу с до 10 изображениями-референсами одновременно, обеспечивая консистентность персонажей, продуктов и стилей, что позволяет создавать серии изображений с едиными героями. Модель обеспечивает фотореалистичность и детализированную прорисовку текстур, стабильное освещение и качество, подходящее для визуализации.

Архитектура построена на latent flow matching, объединяющей генерацию и редактирование, с интеграцией Mistral-3 24B vision-language модели для понимания контекста, использованием Rectified Flow Transformer для работы с пространственными отношениями и композицией, а также новым VAE, обученным с нуля. Бесплатно модель доступна для тестирования через FLUX Playground и скачивания открытых весов на Hugging Face.

Тестируем!

FLUX.2 умеет работать с текстом, создавая сложную типографику, инфографику, мемы и UI-макеты, при этом мелкий текст остаётся читаемым. Она поддерживает редактирование изображений с разрешением до 4 мегапикселей, гибкие соотношения сторон и сохраняет детали при изменении.


MAI-Image-1

Сервис доступен в Bing Image Creator и мобильном приложении Bing. Это первая крупная text-to-image система, полностью созданная внутри Microsoft, без участия OpenAI или сторонних лабораторий.

Главное отличие в оптимизации под голосовые и визуальные ассистенты Microsoft. MAI-Image-1 интегрирована в Copilot Audio Expressions, где она визуализирует истории, описанные голосом пользователя. Таким образом, Copilot теперь может не только рассказать, но и показать рассказ.

Тестируем!

Модель построена на усовершенствованной архитектуре Diffusion XL, обучалась на мультиязычном корпусе данных, и поддерживает текстовые запросы на десятках языков. В России сервис не доступен, поэтому придется искать обходные пути.


Seedream

Платформа-агрегатор, которая позволяет пользователю отправлять один запрос и получать ответы от разных нейросетей (ChatGPT, Claude, Gemini, Grok и др.), всё бок о бок для сравнительного анализа. Пользователь потом выбирает, какой ответ лучше, даёт обратную связь (почему тот вариант показался точнее или полезнее), которая помогает обучать и ранжировать модели.

За активность на платформе (за оценку ответов, сравнение, комментарии) выдаются кредиты, которые можно обменивать на доступ к более мощным моделям.

Тут доступна модель Seedream 4.0 Max, которая использует высокоэффективный диффузионный преобразователь и мощный вариационный автоэнкодер (VAE) для быстрой генерации изображений высокого разрешения от 1K до 4K. 

Тестируем!

Платформа достаточно активно финансируется. В посевном раунде Yupp привлек $33 млн от a16z и других инвесторов. Они делают ставку на то, что пользовательский фидбэк - ключевой фактор в развитии ИИ, и через прозрачность и вознаграждения хотят масштабировать этот подход.


Резюмируя

В конце хочется напомнить, что нейросетям всё ещё рано безоговорочно доверять. Они ошибаются, фантазируют и иногда удивляют не в ту сторону. Они неплохи, но только как помощники, не более. Алгоритмы могут ускорить рутину, упростить сложное, вдохновиться и сэкономить время. Главное помнить, что за всеми этими технологиями стоим мы.

Поэтому доверяйте, но проверяйте. И не забывайте, именно вы направляете всё это в нужное русло!

Спасибо, что дошли до конца! А теперь очередь за вами. Расскажите, какие нейросети уже прописались в ваших закладках? Может, мы забыли про какой-то сервис? Давайте пополним этот список вместе!

Комментарии (1)


  1. XARABA_RU
    26.11.2025 14:04

    мне больше всего нравится nano banana. для повседневных дел, когда нужно именно изменить изображение - идеально справляется. Хорошо понимает, чего от нее хотят. И выдает изображения в том же стиле, без киношных цветов и тд. Просто исправляет то, что нужно исправить.