Рынок графических нейросетей расширяется, причём их возможности растут в геометрической прогрессии. Совсем недавно появилась новая версия Nano Banana, чуть раньше — Seedream v4 и Reve.

Я подумал: почему бы не сравнить эти три модели? Уровни генерации у них примерно одинаковы, возможно, получится что‑нибудь любопытное.

Итак, сегодня мы рассмотрим: Nano Banana (берём первую версию, вторая была бы слегка не равноценна по отношению к конкурентам), Seedream v4 и Reve. Постараемся осветить некоторые интересные возможности, если они имеются, а также попробуем определить, какая из моделей справляется лучше с поставленными задачами.

Устраивайтесь поудобнее - мой рассказ начинается.


Пару слов о тестировании

Здесь не будет высокотехнологичного оценивания - только моё личное мнение и наблюдение за результатами.

Каждое задание оценивается по балльной шкале, итоговый результат складывается из суммы набранных баллов. Коротко говоря, выглядит это следующим образом: 1 балл — за полностью выполненное задание, 0,5 балла — за частично выполненное и 0 баллов — за совершенно неудовлетворительный результат. Дополнительно бонусом будут учитываться некоторые специфические возможности вроде отображения пейзажа местности по стрелке на карте у Nano Banana.

Для каждой модели предусмотрено по три генерации: лесная местность с деревянным домиком, девушка, сидящая в кафе и держащая чашечку кофе, и самурай в мультяшном стиле с футболкой, на которой изображен единорог. Здесь описание дано предельно лаконично, тогда как непосредственно в самих промтах всё изложено более подробно..


Первое испытание

Nano Banana

Первым на плацдарм выйдет банановое чудо, которое я уже тестировал в одной из своих статей. Общий промпт для первого испытания:

Photorealistic shot, first-person view from a forest path at dusk. The path leads directly towards an old, slightly crooked log cabin nestled between tall pine and maple trees. The trees have vibrant autumn foliage in shades of crimson, amber, and gold. A faint, cool mist hangs in the air, softening the details. A worn, wooden bench sits by the side of the path, slightly overgrown with moss. Warm, inviting light glows from the cabin's small window, and a thin plume of smoke rises from its stone chimney, contrasting with the chilly evening air. The atmosphere is serene yet holds a sense of gentle mystery, as if the cabin holds an untold story. Masterful photography, hyperrealistic, cinematic lighting, wide-angle lens, atmospheric haze.

Промпт объемный, посмотрим, каким будет итоговый результат.

Nano Banana учёл все мои пожелания, серьезных претензий у меня нет, если не считать мелких деталей вроде того, что у нас настоящий дом, а не хижина, как мне хотелось бы. Конечно, по большому счёту - это лишь мои личные придирки.

Seedream v4

На Nano Banana у меня возникла мысль - а как я буду оценивать генерации исходя из поставленной мною же системы? В моих ожиданиях все они должны справиться +- на одинаковом уровне.

Однако SeeDream v4 немного сел в лужу уже на первом задании. Вряд ли такой результат можно считать удовлетворительным. Лично я поставлю оценку ноль баллов, даже несмотря на то, что само по себе задание выполнено. Фокус у нас на окне, всё остальное по большей части размыто либо имеет довольно низкое качество.

Reve

 

Здесь результат уже лучше. Качество изображения, на мой взгляд, даже выше, чем у Nano Banana.

И конечно, без косяков здесь тоже не обошлось: почему лавочка стала подобием какой-то телеги? Да ещё и разбитой... С одной стороны, качество генерации мне нравится больше, а с другой - в первую очередь важна полнота выполнения задания. Итак, начислим половину балла и пойдем дальше.

Промежуточный итог

Nano Banana - 1 балл.

Seedream v4 - 0 баллов.

Reve - 0,5 балла.


Небольшое дополнение

Перед переходом к основной части статьи хочу отметить, что Nano Banana взята у агрегатора нейросетей BotHub. Если вы хотите провести собственные тесты и сравнить её с другими нейросетями для генерации контента, то при регистрации по специальной ссылке можно получить 100 000 капсов для доступа к большому количеству разных моделей.

Модели Reve и Seedream v4 взяты с официальных сайтов.

Второе испытание

Nano Banana

Второй тест по счету, начинаем опять же с Nano Banana. Здесь я немного изменю условия. Пусть модели следуют в порядке порядке убывания набранных баллов: Nano Banana, Reve, Seedream v4.

Сам промт для второго теста:

Photorealistic shot, cinematic composition. A thoughtful elegant blonde girl with bright green eyes sits at a table by the window in a classic Parisian cafe in the morning. She holds a white porcelain cup with coffee, a faint wisp of steam rising from it. A perfect croissant lies on the small marble table next to her bag. In the softly blurred background, a few other patrons are visible. The focal point is the large window behind her, framing a clear view of the Eiffel Tower bathed in the soft morning light. Shallow depth of field, warm and cozy atmosphere with a touch of melancholy.

Особых нареканий нет. Проверил, всё ли в порядке с руками - было бы интересно, если бы одна из моделей добавила лишний палец... Полбалла Nano Banana забирает, но один минус я всё же нашёл.. Немного смущает, что сама девушка не выглядит живой при запросе с задачей фотореалистичности. Как будто пластиковую куклу посадили и всунули ей в руки чашку кофе.

Reve

Стало интересно. Вот вроде бы всё шикарно, а с другой стороны у девушки глаз поплыл, да и что-то не то с рукой у чашки... Приблизил, посмотрел - и теперь пытаюсь выкинуть это из головы:

Приношу извинения за свои художества, но не могу выбросить этот образ из головы. Да и с другой рукой - аналогично с пальцами - тоже происходит что-то неестественное. Потом обратил внимание, что и с сумкой (одной из двух, почему их две?) творится что-то неладное. По крайней мере определить, что стоит рядом с ней, я так и не смог.

С одной стороны, косяки, которых в нынешних моделях уже редко увидишь, а с другой стороны Reve предлагает сразу четыре варианта генерации, поэтому выберу что-нибудь получше, если такое имеется.

А вот тут уже всё интереснее, здесь поставлю балл без зазрения совести. Все условия выполнены, да и придраться не к чему. Девушка задумалась, с кем такого не бывало? Оттого и взгляд куда-то вдаль, в светлое будущее.

Seedream v4

На этот раз Seеdream v4 показывает себя лучше, но, на мой взгляд, не дотягивает до полного балла.. Объясню свою позицию, вернее, две вещи, которые меня смущают. Первое - круассан, одиноко лежащий прямо на столе. Второе - глаза, словно неестественно зеленые, слишком яркий цвет.

Промежуточный итог

Nano Banana - 1,5 балла.

Reve - 1,5 балла.

Seedream v4 - 1 балл.

Третье испытание 

Nano Banana

Думаю, многие заметят, что с каждым новым испытанием меняется и сложность задания, и его тематика. По крайней мере, для сравнения мне кажется такой подход вполне логичным: чем дальше - тем сложнее.

Full-body portrait of a stylish samurai in a dynamic stance. He is wearing bold red samurai armor. A white cotton t-shirt with a graphic of a unicorn and the word 'MAGIC' is worn OVER the top of his chest armor, not underneath. He has a red katana and a Chinese conical hat (douli). Setting is a vibrant, bustling anime city. Art style: high-quality anime, sharp details, bold colors.

Косплееры нынче пошли, конечно, интересные. Я дам полбалла, несмотря на достаточно качественную генерацию. Задание не выполнено в полной мере, так, как этого хотелось бы. Например, меня смущают две катаны, но это опустим. Самая интересная часть для меня - увидеть, как модель натянет футболку с единорогом поверх брони, но, увы, Nano Banana сделать этого не смогла. Кстати, может, у вас получится где-то сгенерировать подобный полёт творческой мысли?

Reve

Reve решил не усложнять и нарисовал единорога прямо на броне. Однако ладно бы с этим единорогом - на заднем плане у человека отсутствует нога, у самого самурая непонятно, что происходит с мечом: ножны (точнее, их часть) находятся в одном месте, а кусок чего-то красного — в ноге. Да и у одной руки всего четыре пальца. Пожалуй, Reve получает ноль баллов.

Seedream v4

Пару попыток генерации - а натянуть футболку поверх брони не вышло. Хотя, если всё-таки считать нечто под футболкой полноценной броней, то частично с заданием справился. Кроме этого, опять же смущают ножны, хотя единорог здесь респектный. По моей субъективной оценке, здесь тоже будет полбалла.

Промежуточный итог

Nano Banana - 2 балла;

Reve - 1,5 балла;

Seedream v4 - 1,5 балла;


Побочный эксперимент

Из-за интереса попробовал запихнуть такую же задачу и во вторую версию Nano Banana. Результат получился похожим на генерацию от Reve. Тут хотя бы без серьёзных недостатков, если не обращать внимания на летающие обыкновенные машины.

Дополнительные возможности моделей

Собственно, как я и говорил в самом начале, в расчёт пойдут не только задания, но и дополнительные функции. Благо с момента выхода моделей прошло уже достаточно времени, поэтому найти таковые оказалось несложно. Единственное - я буду их просто перечислять, без конкретных примеров, иначе статья может получиться чересчур длинной.

Начнем с Nano Banana:

  • Объединение изображений;

  • Генерация местности по стрелке на карте;

  • Создание стикеров из фото и нанесение их на какой-либо предмет;

  • Смена позы персонажа по предложенному эскизу.

Reve:

  • Генерация сразу четырех вариантов;

  • Возможность загружать лицо.

Seedream v4:

  • Возможность примерить одежду, вещи на человеке;

  • Аналогичная работа с референсами;

  • Достаточно качественное преобразование стилей изображения.


Итог

Для подведения итогов пусть каждая дополнительная возможность будет равна одной четверти балла. Тогда на первом месте - Nano Banana (что в принципе вполне ожидаемо), на втором - Seedream v4, на последнем - Reve.

Nano Banana действительно держит планку даже в старой версии, пока не говорим о второй и Pro. Хотя лично мне именно в первых двух заданиях больше понравились генерации Reve, дающие более живое изображение, соответствующее задаче.

Спасибо за прочтение!

Комментарии (0)