Нейросети для генерации изображений: обзор топовых ИИ-генераторов для создания изображений и картинок / forpes.ru

Главная
Нейросети для генерации изображений: обзор топовых ИИ-генераторов для создания изображений и картинок

Нейросети для генерации изображений: обзор топовых ИИ-генераторов для создания изображений и картинок +1

02.07.2025 14:20

NeyroEntuziast 13 6900 Источник

Нейросети для генерации изображений: обзор топовых ИИ-генераторов для создания изображений и картинок

Нейросети для генерации изображений развиваются очень быстро, при этом количество пользователей генераторов для создания изображений каждый день становится больше. В этой статье я расскажу про 9 топовых нейросетей для создания изображений, которые вам обязательно нужно попробовать.

Две недели назад я написал про лучшие нейросети для создания видео, чтобы помочь своей аудитории решить, какие ИИ-генераторы стоят их времени и денег. Список я составил на основе собственного опыта, а также на основе того, что это одни из самых обсуждаемых в ИИ-сообществе нейросетей.

Поэтому я подумал, почему бы не сделать то же самое для нейросетей для генерации изображений и картинок?

За последние пару месяцев ИИ-модели значительно улучшились, и в интернете появились сотни платформ для создания изображений. Становится все труднее сравнивать каждую платформу и выяснять, какая из них лучше всего подходит в вашем случае.

Давайте начнем.

1. ChatGPT

GPT-Image-1 - это нативная мультимодальная языковая модель. В отличие от старых и более специализированных моделей для генерации изображений, таких как Dall-E 2 и Dall-E 3, эта новая модель поддерживает как редактирование изображений, так и генерацию текста.

Поскольку GPT-Image-1 уже интегрирована в ChatGPT, все, что вам нужно сделать, - это выбрать модель GPT-4o и описать изображение, которое вы хотите сгенерировать. Нейросеть достаточно умна, чтобы понять, что вы хотите создать изображение, а не получить текстовый ответ.

Вот пример:

Промпт: Реалистичная фотография, современная живая привлекательная высокомодная гламурная версия Моны Лизы с картины да Винчи держит в руках постер с картиной да Винчи „Мона Лиза“. У нее длинные миндалевидные блестящие накрашенные ногти. На изображении не должно быть никакого другого текста.

Мне нравится качество изображения, созданного GPT-Image-1. Оно такое детализированное, и объект имеет правильные черты и пропорции. Также вы можете настроить результат, указав качество, размер изображения, формат файла, степень сжатия, а также указать, нужен ли прозрачный фон.

Вот еще примеры изображений, созданных с помощью GPT-Image-1 в ChatGPT.

Эта новая модель для генерации изображений также доступна через API. Я впечатлен тем, как быстро компании начали интегрировать GPT-Image-1. Adobe, Canva, Figma, GoDaddy и Airtable уже экспериментируют с ней. Модель мощная, быстрая и может работать как с генерацией, так и с редактированием интуитивно понятным способом.

Если вы уже попробовали API, мне было бы интересно узнать ваше мнение. Я видел несколько жалоб на то, что API более ограниченный, чем версия ChatGPT, но сам я не сталкивался с серьезными проблемами, по крайней мере пока.

2. Midjourney

Прошло всего пару недель с тех пор, как Midjourney выпустила новую модель для генерации изображений - V7. В этой версии появились новые функции, которые расширяют возможности платформы.

Чтобы начать, зайдите на Midjourney.com и создайте бесплатный аккаунт. Сейчас MJ больше не предлагает бесплатную генерацию изображений, поэтому вам нужно сразу же купить подписку.

Вот как выглядит панель управления:

Для создания изображения откройте вкладку Create (Создать) на левой панели и опишите изображение, которое вы хотите сгенерировать, в поле для ввода промпта. Обязательно выберите модель V7 из выпадающего меню.

Наконец, нажмите на кнопку Generate и дождитесь появления набора изображений. Ниже - примеры изображений, созданных с помощью Midjourney V7.

Честно говоря, хотя Midjourney был одним из лучших генераторов изображений на протяжении многих лет, в последних двух версиях он был не так хорош. Обновления V7 недостаточно, чтобы убедить меня продлить подписку.

По-моему, Flux Ultra, Imagen 4 и GPT-Image-1 сейчас лучше в плане скорости, фотореалистичности и точности. Тем не менее, я по-прежнему люблю Midjourney и его уникальную эстетику.

3. Приложение Gemini

Компания Google представила модель изображений Imagen 4 во время ключевой презентации на Google I/O 2025. Среди основных особенностей новой нейросети для генерации изображения можно выделить следующие:

Фотореалистичные изображения
Большая четкость
Улучшенная орфография и типографика
Многоязычная поддержка промптов, чтобы помочь создателям по всему миру

Из того, что я успел увидеть, Imagen 4 действительно отличается фотореалистичностью. Посмотрите на некоторые из этих отобранных вручную промптов и результатов.

Промпт: Produce a stunning, award-winning close-up of a chameleon blending into a background of vibrant, textured leaves, its eye swivelled to look directly at the camera. The intricate texture of its skin changing colour is the focus (visceral adaptation). Abstract dappled light filters through the leaves. Inspired by wildlife macro photography and camouflage patterns.

Проще всего использовать Imagen 4 через приложение Gemini. Просто откройте сайт gemini.google.com, войдите в систему под своей учетной записью Google и начните генерировать изображения.

Вот пример:

Промпт: The Quest for the Cheesy Treasure (Retro Comic Style): Drawn with slightly pulpy art, Ben Day dots for shading, dramatic close-ups, and lurid colors (orange, deep purples, oranges). Captions use overly dramatic language. Panel one shows Mittens, an orange tabby cat, approaching a lonely, flickering vending machine in a dark breakroom late at night. Caption: “Some cravings demand EXTRAORDINARY measures!” Panel two is a close-up of the yellow glow emanating from the machine’s selection window with many cheesy puffs, illuminating Mittens’s apprehensive face. Panel three shows a cat leaping at the machine… and nothing. The machine makes a loud CLUNK and WHIRR. Panel four shows a friendly man pressing a button and a cheesy puffs bag fall out. Panel five is a dramatic shot of the triumphant tabby, bathed in lurid orange light, batting open the bag, cheese dust flying dramatically as the caption declares: “The FEAST begins!”

То, как на фото выглядят тексты, очень впечатляет. У меня было слишком много сгенерированных изображений, на которых вместо четких надписей или знаков была белиберда. Imagen 4, похоже, наконец-то делает все правильно.

В целом, я доволен использованием Imagen 4 в различных приложениях Google. Если вы уже используете Slides, Docs, чатбот Gemini или что-то еще из этого списка, Imagen 4 просто станет частью вашего рабочего процесса без необходимости открывать отдельное приложение.

Более высокая скорость и более качественная генерация текста также являются несомненными преимуществами, особенно для тех, кто регулярно создает изображения с текстом.

4. Leonardo AI

Leonardo AI - один из самых любимых нейросетей для генерации изображений, потому что он существует с тех пор, как модели для создания изображений много лет назад стали популярны.

Чтобы начать работу с нейросетью для генерациии изображений, перейдите на сайт Leonardo AI, создайте учетную запись и откройте панель генератора изображений. Вот как она выглядит:

Кому-то может понравиться, как выглядит пользовательский интерфейс, но я, честно говоря, не в восторге. По-моему, он выглядит беспорядочным. Кнопки и другие элементы управления пользовательским интерфейсом разбросаны повсюду. Трудно найти, что нужно настроить перед созданием изображения.

В любом случае, вот пример:

Chinese modern beautiful woman, 20 years old, young and beautiful fashion, exquisite face, fair skin, stage, lighting, bright picture, singing with microphone in hand, slender figure, front full body photo, live photography, high definition, long view

Отсутствие мизинца, на мой взгляд, выглядит странно. Здесь используется модель « Portrait cinematic», так что я думаю, что результат может быть лучше, если я переключусь на другую модель, например Flux Kontext.

У Leonardo также есть активное сообщество: публичные галереи, обмен промптами и конкурсы. Вы можете делать ремиксы чужих изображений или черпать вдохновение в модных произведениях искусства. И да, в комплекте есть встроенный апскейлер, средство удаления фона и множество других полезных инструментов.

5. Freepik

Платформа Freepik, известная своей обширной библиотекой графических ресурсов, недавно представила несколько обновлений на своем сайте. Однако в последние годы компания сосредоточилась на предоставлении ИИ-сервисов, таких как генерация изображений и видео.

Начать работу с Freepik очень просто. Сначала зайдите на сайт, зарегистрируйтесь или войдите в свою учетную запись.

Как только вы увидите панель управления, перейдите в раздел «Generate Images» на вкладке «Create and Edit Images». Так вы перейдете к панели генератора изображений. На панели для генерации изображений выберите предпочтительную модель изображения в меню выбора режима, например «Flux 1.1 Pro».

После этого введите промпт в текстовое поле и нажмите кнопку Generate. Вот пример:

Промпт: An image of a woman enjoying the autumn leaves and throwing them up on the air, she’s wearing a red winter jacket and is very happy. half body Close up front shot

Как всегда, нейросеть Flux никогда не разочаровывает. Лицо женщины получилось выразительным, детали ее рук и пальцев - анатомически точными, а общее ощущение от изображения - радостным и ярким.

Кроме того, в Freepik так много инструментов для редактирования и улучшения изображений, что вам даже не придется уходить с платформы, чтобы продолжить работу с изображениями. Также платформа поддерживает множество других ИИ-инструментов, например, Mockup generator, Designer, Upscaler и другие.

6. Flux (Flux Kontext)

Я уже несколько раз упоминал нейросеть Flux в этой статье, но сейчас я расскажу о ней еще раз. Компания Black Forest Labs, представив Flux Kontext, вывела редактирование изображений с помощью ИИ на новый уровень.

Flux Kontext - это набор генеративных моделей сопоставления потоков, которые позволяют создавать и редактировать изображения. В отличие от существующих моделей преобразования текста в изображение, семейство Flux Kontext выполняет генерацию изображений в контексте, позволяя вам использовать как текстовый промпт, так и референсное изображение, а также легко извлекать и изменять графические элементы для получения новых, согласованных результатов.

Чтобы использовать Flux Kontext, перейдите на сайт Flux Labs AI и бесплатно создайте учетную запись. В выпадающем меню AI Tools выберите Image Manipulator, и вы будете перенаправлены на страницу редактирования изображений.

На странице редактирования изображения необходимо загрузить исходное изображение. Убедитесь в том, что его размер не превышает 3 МБ и что оно имеет один из следующих форматов: JPG, PNG или WEBP.

Давайте попробуем изменить фон фотографии с азиатской женщиной в заснеженную улицу с помощью этого промпта:

It’s now snowing, everything is covered in snow

Для этого примера я установил соотношение сторон 16:9 и использовал модель Flux Kontext Max. Наконец, нажмите на кнопку отправки и дождитесь, пока будет сгенерировано итоговое изображение. Вот конечный результат:

Во-первых, изображение генерируется быстро. Для этого примера потребовалось всего 3 секунды. Во-вторых, качество превосходное. Посмотрите, как точно и реалистично прорисованы детали снега. Невероятно хорошо прорисованы даже следы от колес на дороге.

Вы можете продолжить рабочий процесс, описав дальнейшие изменения, которые вы хотите внести. Это действительно здорово.

7. Ideogram

Ideogram - одна из самых обсуждаемых во многих ИИ-сообществах платформ. Помимо быстрого и интуитивно понятного веб-приложения для создания изображений, они также разрабатывают собственные модели нейросети для создания изображений.

Совсем недавно они выпустили свою новейшую модель, V3, с улучшенной реалистичностью, более разнообразными стилями и улучшенным следованием промптам.

Посмотрите на этот пример изображения:

Довольно круто, правда? Уровень детализации кожи и точность прорисовки текста на фоне впечатляют.

Чтобы начать работу с нейросетью Ideogram, перейдите на сайт ideogram.ai и войдите в систему, используя учетную запись Google или Apple. Войдя в систему, опишите изображение, которое хотите создать, задайте предпочтительную модель изображения и нажмите на кнопку Generate.

Вот пример изображения, созданного с помощью модели Ideogram 2.0.

Промпт: A young East Asian woman, either a teenager or a working adult, standing outdoors under a clear blue sky. She raises one arm above her head to shield her eyes from the sunlight. She is wearing a red blazer. Her skin appears smooth and glowing. The scene is captured in natural light with soft shadows. The background is plain and light-colored. The overall style is clean, fresh, and minimalist, resembling a studio-like aesthetic. No product, no logo, no text in the image.

Кроме того, в Ideogram Canvas вы можете использовать Magic Fill и Extend с 3.0 для редактирования как загруженных, так и сгенерированных изображений.

8. Sora

Возможно, вы знаете Sora как популярный инструмент от OpenAI для генерации AI-видео. Но Sora также может генерировать изображения. Если вы зайдете на сайт Sora, то заметите, что под окошком для ввода промпта есть опция переключения с видео на изображение.

Если вы это сделаете, нейросеть Sora будет генерировать изображения только на основе текстовых описаний. Вот пример:

Промпт: An ultra-realistic glass apple resting on a pristine white surface. The apple is hyper-detailed, with intricate reflections and light refractions across its smooth, glossy surface. Inside the transparent glass, subtle rainbow glares and tiny imperfections give it lifelike depth. The lighting is soft but sharp, capturing every gleam and shadow for ASMR visual appeal. Studio-quality macro shot with a shallow depth of field — the background is softly blurred, emphasizing the elegant, fragile beauty of the glass fruit. High-resolution, cinematic detail, 4K realism. Have hands in black plastic gloves, cut the apple into thick juicy slices with a sharp knife to fulfill the ASMR aspect.

Я предпочитаю генерировать изображения в нейросети Sora, а не в ChatGPT, потому что это дает мне больше контроля над тем, как будет выглядеть итоговое изображение.

Например, вы можете изменить соотношение сторон, количество выдаваемых результатов и даже задать предустановленный промпт. Это также отличная платформа, если вы планируете превратить свои сгенерированные изображения в видео - нет необходимости переключать инструменты.

9. Adobe Firefly

Firefly - это семейство генеративных ИИ-моделей, которые позволяют любому пользователю, даже не являющемуся экспертом, генерировать высококачественные изображения, потрясающие текстовые эффекты и шаблоны дизайна за считанные секунды по текстовым промптам.

Firefly будет встроен в некоторые из основных приложений Adobe, таких как Photoshop, Express и Lightroom.

Чтобы начать работу, перейдите на сайт Adobe Firefly и войдите в систему под своей учетной записью Adobe. В разделе General settings (Общие настройки) в выпадающем списке моделей выберите «Firefly Image 3 (preview)».

Вы можете поиграть с настройками соотношения сторон, структуры, стиля и эффектов. Затем просто опишите изображение, которое вы хотите создать. Вот пример:

A heavenly sky full with etherial, misty fluffy clouds with sparkles. Clear, bright blues, purples, pinks.

Я попробовал сделать его в гиперреалистичном стиле, и при каждой генерации создается четыре разных версии на выбор. Вы можете кликнуть на них, чтобы увидеть увеличенную версию и загрузить понравившуюся.

Довольно прилично, но не так здорово, как в нейросети GPT-Image-1 или Flux Kontext.

Пожалуй, главным преимуществом использования модели Adobe является тот факт, что они обучались только на собственных изображениях. Если вас так волнуют вопросы безопасности и этики, стоит обратить внимание на эту модель.

Ну вот, пожалуй, и все. Надеюсь, этот список нейросетей для генерации изображений был вам полезен и, возможно, вы узнали несколько новых нейросетей. Сейчас существует много платформ и нейросетей для создания изображений, и у каждой из них есть свои сильные стороны.

Если вы знаете какой-либо другой инструмент, которого нет в этом списке, не стесняйтесь рассказать о нем в комментариях.

Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети, чтобы не пропускать анонсы статей, и на канал с гайдами и советами по работе с нейросетями - я стараюсь делиться только полезной информацией.

Комментарии (13)

MountainGoat
02.07.2025 15:17
#28518748
Платить сложно, возможностей мало, дурная цензура. Все сервисы - это так, побаловаться. Кто хочет нормальные результаты - запускайте у себя, благо достаточно видюхи *070Ti.
1. Abstraction
  02.07.2025 15:17
  #28518794
  Есть какие-то конкретные соображения почему InvokeAI, а не Automatic1111 или ComfyUI?
  (Я открывал статью как раз с надеждой что в ней будет актуальное сравнение систем этого рода, а то сейчас грустно пытаюсь пропатчить sd-webui-SAG до работающего состояния. В статье нет, но может есть у комментаторов?)
  1. MountainGoat
    02.07.2025 15:17
    #28518834
    Соображение одно: Юзырь Экспириенс. В InvokeAI меньше фич, но он продуман как инструмент для гуманитария. Чтобы воспользоваться функцией, не обязательно знать, как она реализована. Всё просто и надёжно.
    
    ComfyUI я тоже использую и люблю. Но Comfy - это чтобы попользовать новую технологию, а Invoke - чтобы делать картинку. Видите разницу? Invoke я открываю, чтобы быстро сделать карикатуру и кинуть в политический чат. А Comfy - только чтобы попробовать новую модель и методику с Реддита.
    
    А Auto111 не знаю что делает в этом списке. Глючное говно с агрессивной саморекламой путём захвата чужого имени.

OlegZH
02.07.2025 15:17
#28519408
А зачем, вообще, кому-то нужно что-то создавать? Да, отдельные эксперименты могут быть интересны. Как инструмент, реализующий некоторые особые идеи художников, да. Но зачем нужна эта генерация в промышленным масштабах? И не окажется ли потом, что все эти картинки, "нарисованные" ИИ, обладают неким дефектом (пока ещё не вполне осознаваемым), который плохо влияет на мозги. Рискну предположить и такое. Уж, извините.
1. MountainGoat
  02.07.2025 15:17
  #28519536
  Народ ещё зомбирования по 5G бояться не перестал, а вы уже нагнетаете.

Нейросети для генерации изображений: обзор топовых ИИ-генераторов для создания изображений и картинок +1

1. ChatGPT

2. Midjourney

3. Приложение Gemini

4. Leonardo AI

5. Freepik

6. Flux (Flux Kontext)

7. Ideogram

8. Sora

9. Adobe Firefly

Комментарии (13)

MountainGoat

Abstraction

MountainGoat

OlegZH

MountainGoat