Kandinsky 6.0 Image Pro — новый уровень редактирования изображений / forpes.ru

Главная
Kandinsky 6.0 Image Pro — новый уровень редактирования изображений

Kandinsky 6.0 Image Pro — новый уровень редактирования изображений +18

28.04.2026 11:00

nikgerasimenko 27 11000 Источник

В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5, включая Text‑to‑Image и Image Editing Lite. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro. Новая модель работает более качественно и стабильно в задачах генерации изображений по тексту, но особое внимание мы уделили именно задаче редактирования. По результатам сравнений Kandinsky 6.0 Image Pro работает на уровне Flux 2 Max и превосходит GPT Image 1.5. При этом, благодаря переходу к архитектуре MoE, эффективного распараллеливания инференса и оптимизации механизма внимания, модель удалось ускорить более чем на 40% по сравнению с предыдущей версией.

Side-By-Side сравнения Kandinsky 6.0 Image Pro с другими моделями. Первое число над каждым столбцом — доля побед Kandinsky.

Также к релизу новой модели мы интегрировали механизм Image RAG: при запросе пользователя осуществляется поиск в базе знаний и, при необходимости, добавление релевантных изображений в контекст. Благодаря этому значительно выросло знание тонкостей отечественного культурного кода, и, кроме того, появилась возможность постоянно расширять и актуализировать знания модели без полного её переобучения. Причем Image RAG работает не только в режиме генерации по тексту, но и в режиме редактирования — можно сгенерировать себя, например, с любимым киногероем:

База знаний постоянно пополняется как актуальными объектами, персонажами и стилями, так и тщательно отобранными референсами объектов национальной культуры, благодаря чему корректно генерируются, например, мезенская роспись:

"Белая глиняная кружка с мезенской росписью" — «Белая глиняная кружка с мезенской росписью»

Или картуз:

Примеры и сценарии применений

Kandinsky 6.0 Image Pro поддерживает все основные виды редактирования изображений, выполняя их с высоким уровнем качества. Например, сложные виды удаления объектов и надписей, с сохранением консистентности:

«Паренек в картузе едет на велосипеде» — «Убери граффити и надписи на стене»

Замену объектов, причём с учётом стиля изображения:

«Убери граффити и надписи на стене» — «Замени яблоко на банан»

Стилизацию фото человека с сохранением черт лица:

«Замени яблоко на банан» — «Перерисуй в стиле рисунка цветными карандашами»

И не обязательно человека:

«Перерисуй в стиле рисунка цветными карандашами» — «Сделай в стиле мягкой игрушки»

Отлично работает реставрация и колоризация старинных фотографий:

Кстати Kandinsky интегрирован в сервис «Бессмертный полк онлайн», где он помогает восстанавливать архивные фото ветеранов ВОВ.

Одним промтом можно создавать дизайн экстерьеров и фасадов зданий:

"Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение , парковая зона. Вечернее время." — «Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение, парковая зона. Вечернее время.»

Или создать интерьер по схеме помещения:

Применений новой модели множество: меняйте фон, освещение, прическу или макияж, примеряйте одежду, добавляйте и удаляйте надписи, управляйте выражением лица или фигурой человека на фото. Пробуйте и находите новые новые идеи с Kandinsky 6.0 Image Pro на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в Android‑приложении. Кстати в ближайшее время на всех поверхностях станет доступно редактирование по 3 референсам, а также появится функция детального редактирования – можно будет с помощью специальной кисти показать модели, куда именно добавить новый объект или, наоборот, что именно удалить с картинки, прям вот так:

Так что следите за обновлениями, с наступающими майскими праздниками и крутых вам генераций! ✨✨✨

Комментарии (27)

fire64
28.04.2026 11:08
#29897958
Это все конечно хорошо, но когда вы уже научите свои модели рисовать текст на кириллице?

В боте в прошлом году она рисовала аброкадабру....

Почему иностранные модели и то на русском рисуют, а ваша отечественная нет? У Яндекс Арта та же проблема....
1. nikgerasimenko Автор
  28.04.2026 11:08
  #29898086
  Здравствуйте! Короткие тексты (3-7 слов) Kandinsky генерит достаточно стабильно уже сейчас. В следующей версии модели планируем значительно усилить этот навык, вплоть до полноценной генерации инфографики.

BazilioMike
28.04.2026 11:08
#29897986
Персонажей как не знала модель Kandinsky 6.0 она многих, так и не знает. Попробовал сделать, чтобы мужчина сидел в квартире, сидел на стуле, рядом с ним на стуле сидела Alcina Dimitrescu из Resident Evil Village, точный образ её в шляпе и белом платье перенеси, и всё должно выглядеть словно фото. В итоге создает кого угодно, но даже рядом не похожих на Alcina Dimitrescu. Попробовал и других — всё то же самое. Дальше и не стал больше, по сути, ничего не поменялось, а само качество изображения как было размазанная картинка, так и осталось, четкости не прибавилось, при генерации картинка размазывается сильно в области лиц.

BazilioMike
28.04.2026 11:08
#29898248
Обрубок на основе Prompt.
1. nikgerasimenko Автор
  28.04.2026 11:08
  #29899058
  Здравствуйте! в mini-app в Telegram и Max есть позможность выбора формата генерации. Это вот раздел "Меню" в чатах.
  1. BazilioMike
    28.04.2026 11:08
    #29899386
    Здравствуйте! Я в основном пользуюсь именно веб-версией Gigachat, считаю ее основой, потому что именно там удобнее всё делать. Странно, что эту функцию уже 3 года не включили в веб-версию. А Telegram не работает сейчас в России. Max я больше не ставлю после того, как у меня из-за него перестали обычные звонки принимать.
    
    nikgerasimenko Автор
    28.04.2026 11:08
    #29899804
    Здравствуйте! Генерацию произвольного соотношения сторон в чате в ближайшее время планируем докатить, можно будет прям в промте написать, какое соотношение хочется, а если не указано, модель будет подбирать его сама под запрос

BazilioMike
28.04.2026 11:08
#29898510
Конечно, это не оригинальный Spawn вышел.

yamabusi
28.04.2026 11:08
#29899696
Очень жаль и весьма,что на оф.сайте возможно генерация только с соотношением 1:1.
Это прям большой минус.

А в целом модель просто отличная,на голову выше иных,даже 5.0,искренне не понимаю,почему её прям не любят в ветках Reddit,даже упоминание,а тему зачастую даже не дадут создать,тем паче странно,ведь есть даже в шаблонах Комфи,не дают вообщем популяризировать. ><
1. nikgerasimenko Автор
  28.04.2026 11:08
  #29899802
  Здравствуйте! Генерацию произвольного соотношения сторон в чате в ближайшее время планируем докатить, можно будет прям в промте написать, какое соотношение хочется, а если не указано, модель будет подбирать его сама под запрос
  1. BazilioMike
    28.04.2026 11:08
    #29899876
    Я попробовал вручную вписать 9:16, да, сработало, только я не всегда помню форматы и не знаю, какие поддерживает Gigachat, с помощью раскрывающегося меню было бы удобнее выбрать соотношения сторон:
    Квадрат (1:1)
    Пейзаж (16:9)
    Портрет (9:16)
    Классика (4:3)
    Выс. портрет (3:4)
    Ультраширокий (21:9)
    
    yamabusi
    28.04.2026 11:08
    #29901186
    А можно поподробнее,я как не пытался,не получилось и просил чатбота и прописывал в промте например --aspect 16:9 ,да много способов перепробовал,упорно генерит 1:1
    Очень странно это,тем паче в Телеграме бот позволяет выбрать соотношение сторон
    
    Ещё и нагло врёт. :)

Kristaller486
28.04.2026 11:08
#29899868
Опенсорс планируется? Моделька хорошая, но не закрытой.

BazilioMike
28.04.2026 11:08
#29901184
Интересно как заставить редактор Изображения понять что нужно с высоты птичьего полета ракурс сделать как бы не просил все равно с земли делает ракурс и при генерации и при редактировании изображения:
A breathtaking bird’s-eye perspective of a sprawling post-apocalyptic crater, captured with a Hasselblad H6D and a 28mm wide-angle lens at f/8. Where once there was a lush resort, now lies a jagged architectural graveyard of twisted rebar and scorched concrete. A vibrant, toxic river of luminescent neon-teal chemical waste flows through the center, its surface churned into white foam by howling winds. The atmosphere is thick with heavy fog and swirling embers, creating a moody, epic chiaroscuro effect. Sharp, dramatic light pierces through the smog, illuminating the intricate debris and fine textures of rust and ash. The color palette is intensely vibrant, contrasting deep obsidian shadows with electric oranges and radioactive violets. Every detail is rendered with professional clarity, from the tattered remains of sky-bridge cables whipping in the gale to the cracked, parched earth of the surrounding desolation.

Kandinsky
===========
Эта правильная

Shedevrum
1. yamabusi
  28.04.2026 11:08
  #29901216
  Имхо не тут такие вопросы задавать,с уважением,это вопрос сугубо промтинга и только даже не касательно одной модели,зачем создателей на такие банальные вещи пытать.
  Начните например с strictly top‑down и лучше с Perplexity на эту тему побеседуйте. ><
  1. BazilioMike
    28.04.2026 11:08
    #29901478
    
    yamabusi
    28.04.2026 11:08
    #29906314
    Ладно,лучше в Телеге бот,хотя там быстро дневной лимит вычерпывается.
    У меня категорически не работает такой способ как вы выше написали.
    
    yamabusi
    28.04.2026 11:08
    #29906326
    Ещё раз вам говорю-это не Ошибка. ><
    Я вам как пример привёл рандомный,что вы не можете с частботом перебрать иные варианты? Вы давно генерациями занимаетесь,я вам говорю,что эти лишь вопрос промтинга,кстати Большинство,особенно локальных по опыту тупят с видом сверху,а тут всё ок ещё. Зачем вы такой мелочёвкой их пытаетесь бесполезно озадачить. ;)
    
    Лучше бы они турбо вариант локального Кандинского 5 выкатили или LoRA для меньших шагов,вот что полезнее весьма.
    
    Nadir view, pure top-down orthographic aerial photograph of a city. NO perspective, NO vanishing point. Looking exactly straight down at highly detailed realistic textures: asphalt, concrete rooftops, cars. Flat lay photography style but of a huge city scale
    
    yamabusi
    28.04.2026 11:08
    #29906330
    60-degree top-down aerial photograph of a modern city, orthographic camera, zero tilt. Looking directly down at realistic building rooftops with AC units, solar panels, and antennae. Real shadows cast by objects, cars on the streets, people walking. High detail, photorealistic, raw drone photography, sunny day, deep textures

IamSVP
28.04.2026 11:08
#29902284
в примере «Убери граффити и надписи на стене» также пропала надпись на полу, т.е. была затронута нередактируемая область, ну либо модель не правильно поняла промпт

manyakRus
28.04.2026 11:08
#29903030
Спасибо авторам :-)
модель хорошо рисует русские буквы, лучше многих других ИИ
(ChatGPT ещё лучше, только меня туда не пускают даже с VPN)

Mishootk
28.04.2026 11:08
#29904742
Я могу сказать, что постобработка моего моего наброска до полиграфического варианта меня впечатлила. До этого не пользовался никакими улучшайзерами.

andreyft
28.04.2026 11:08
#29906692
Зашел. Модель пишет, что не имеет возможности редактирования вложенных изобрежений. Это как соотносится с тем, что здесь написано?
1. Mishootk
  28.04.2026 11:08
  #29907226
  Я играл с моделью через макс, периодически отказывается обрабатывать предложенное изображение. Через час-другой точно такой же запрос обрабатывает. На профессиональное использование такого варианта не тянет, но чисто для себя поиграть - вполне достойно. Руками я все равно такой результат получил бы намного позже.

Emil290426
28.04.2026 11:08
#29906706
Когда ваша модель научиться нормально писать на русском языке? Это же позор какой то, даже китайские локальные модели уже умеют нормально писать на русском

для сравнения

Кандинский 6.0 Онлайн
Ernie Image локально в ComfyUI
1. Mishootk
  28.04.2026 11:08
  #29908308
  Две левые китайские ноги вас смущают меньше чем текст. Если выбирать между текстом и картинкой, я бы жертвовал текстом, его можно и отдельно наложить. Но я соглашусь, что приятно, когда и текст тоже генерируется правильно.

DanilAi
28.04.2026 11:08
#29908918
Не понимаю, как у вас получается так «идеально редактировать и генерировать» но для пользователя ничего не изменилось в интернете про генерирований изображений не умеет, вот просто попросить пусть в моем селфи будет Раин Гослинг, то он генерирует совершенно иное просто сгенерированный персонаж который похож сильно на меня, попросил сделать так чтоб в моей комнате стояли «близняшки левая и правая из Atomic heart» сгенерировал совершенно другую комнату и то не близняшек а двух женщин и то в стиле цветных карандашей, это доказывает что kandinsky не умеет генерировать персонажей и объектов из «интернета» в то время когда у Chat GPT и других западных моделей таких проблем нет, скину пример редактированных фоток промнт писал на русском для обеих моделей

1 Kandinsky 6

2 ChatGPT

И много других вариантов пробовал ничего не поменялось, притом GigaChat пишет «вот добавил близняшек из Атомик харт в тебе в комнату» либо криво работает, либо поиск объектов или персонажей при генерации/редактирования не работает пока-что либо не знаю

Для меня как и многих загадка как вы ваще тестируете новую модель, когда как вы говорите «стоит на равне с передовыми моделями генераций/редактирования изображений» когда как если китайские модели, самые нишевые китайские бесплатные модели генерируют/редактируют 10 раз лучше чем Kandinsky 6 снова говорю для меня загадка как вы ваще тестируете если в постах социальных сетях реклама «генерирует как передовые модели» но когда сам пробуешь результат даже близко не похож
1. DanilAi
  28.04.2026 11:08
  #29909326
  Kandinsky 6 прокачали чтоб изменять внешность хорошо, тип сделай волосы длиннее, сделай эльфийские уши, то есть самые «частые» запросы которые делает каждый второй, и можно сказать уровень редактирования как у Flex 2 max, но уровень как у image 2 ChatGPT отстает прям сильно особенно добавлять персонажей из «интернета» редактировать например что то убрать из фото модель уже может, ну а в плане генерации изображения тож прокачали теперь «лица» у людей нормальные и пять пальцев, а не шесть

Kandinsky 6.0 Image Pro — новый уровень редактирования изображений +18

Примеры и сценарии применений

Комментарии (27)

nikgerasimenko Автор

nikgerasimenko Автор

nikgerasimenko Автор

nikgerasimenko Автор