В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5, включая Text‑to‑Image и Image Editing Lite. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro. Новая модель работает более качественно и стабильно в задачах генерации изображений по тексту, но особое внимание мы уделили именно задаче редактирования. По результатам сравнений Kandinsky 6.0 Image Pro работает на уровне Flux 2 Max и превосходит GPT Image 1.5. При этом, благодаря переходу к архитектуре MoE, эффективного распараллеливания инференса и оптимизации механизма внимания, модель удалось ускорить более чем на 40% по сравнению с предыдущей версией.

Также к релизу новой модели мы интегрировали механизм Image RAG: при запросе пользователя осуществляется поиск в базе знаний и, при необходимости, добавление релевантных изображений в контекст. Благодаря этому значительно выросло знание тонкостей отечественного культурного кода, и, кроме того, появилась возможность постоянно расширять и актуализировать знания модели без полного её переобучения. Причем Image RAG работает не только в режиме генерации по тексту, но и в режиме редактирования — можно сгенерировать себя, например, с любимым киногероем:

База знаний постоянно пополняется как актуальными объектами, персонажами и стилями, так и тщательно отобранными референсами объектов национальной культуры, благодаря чему корректно генерируются, например, мезенская роспись:

Или картуз:

Примеры и сценарии применений
Kandinsky 6.0 Image Pro поддерживает все основные виды редактирования изображений, выполняя их с высоким уровнем качества. Например, сложные виды удаления объектов и надписей, с сохранением консистентности:

Замену объектов, причём с учётом стиля изображения:

Стилизацию фото человека с сохранением черт лица:

И не обязательно человека:

Отлично работает реставрация и колоризация старинных фотографий:

Кстати Kandinsky интегрирован в сервис «Бессмертный полк онлайн», где он помогает восстанавливать архивные фото ветеранов ВОВ.
Одним промтом можно создавать дизайн экстерьеров и фасадов зданий:

Или создать интерьер по схеме помещения:

Применений новой модели множество: меняйте фон, освещение, прическу или макияж, примеряйте одежду, добавляйте и удаляйте надписи, управляйте выражением лица или фигурой человека на фото. Пробуйте и находите новые новые идеи с Kandinsky 6.0 Image Pro на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в Android‑приложении. Кстати в ближайшее время на всех поверхностях станет доступно редактирование по 3 референсам, а также появится функция детального редактирования – можно будет с помощью специальной кисти показать модели, куда именно добавить новый объект или, наоборот, что именно удалить с картинки, прям вот так:

Так что следите за обновлениями, с наступающими майскими праздниками и крутых вам генераций! ✨✨✨
Комментарии (27)

BazilioMike
28.04.2026 11:08Персонажей как не знала модель Kandinsky 6.0 она многих, так и не знает. Попробовал сделать, чтобы мужчина сидел в квартире, сидел на стуле, рядом с ним на стуле сидела Alcina Dimitrescu из Resident Evil Village, точный образ её в шляпе и белом платье перенеси, и всё должно выглядеть словно фото. В итоге создает кого угодно, но даже рядом не похожих на Alcina Dimitrescu. Попробовал и других — всё то же самое. Дальше и не стал больше, по сути, ничего не поменялось, а само качество изображения как было размазанная картинка, так и осталось, четкости не прибавилось, при генерации картинка размазывается сильно в области лиц.

BazilioMike
28.04.2026 11:08
Обрубок на основе Prompt. 
nikgerasimenko Автор
28.04.2026 11:08Здравствуйте! в mini-app в Telegram и Max есть позможность выбора формата генерации. Это вот раздел "Меню" в чатах.

BazilioMike
28.04.2026 11:08Здравствуйте! Я в основном пользуюсь именно веб-версией Gigachat, считаю ее основой, потому что именно там удобнее всё делать. Странно, что эту функцию уже 3 года не включили в веб-версию. А Telegram не работает сейчас в России. Max я больше не ставлю после того, как у меня из-за него перестали обычные звонки принимать.

nikgerasimenko Автор
28.04.2026 11:08Здравствуйте! Генерацию произвольного соотношения сторон в чате в ближайшее время планируем докатить, можно будет прям в промте написать, какое соотношение хочется, а если не указано, модель будет подбирать его сама под запрос

yamabusi
28.04.2026 11:08Очень жаль и весьма,что на оф.сайте возможно генерация только с соотношением 1:1.
Это прям большой минус.А в целом модель просто отличная,на голову выше иных,даже 5.0,искренне не понимаю,почему её прям не любят в ветках Reddit,даже упоминание,а тему зачастую даже не дадут создать,тем паче странно,ведь есть даже в шаблонах Комфи,не дают вообщем популяризировать. ><

nikgerasimenko Автор
28.04.2026 11:08Здравствуйте! Генерацию произвольного соотношения сторон в чате в ближайшее время планируем докатить, можно будет прям в промте написать, какое соотношение хочется, а если не указано, модель будет подбирать его сама под запрос

BazilioMike
28.04.2026 11:08Я попробовал вручную вписать 9:16, да, сработало, только я не всегда помню форматы и не знаю, какие поддерживает Gigachat, с помощью раскрывающегося меню было бы удобнее выбрать соотношения сторон:
Квадрат (1:1)
Пейзаж (16:9)
Портрет (9:16)
Классика (4:3)
Выс. портрет (3:4)
Ультраширокий (21:9)
yamabusi
28.04.2026 11:08А можно поподробнее,я как не пытался,не получилось и просил чатбота и прописывал в промте например --aspect 16:9 ,да много способов перепробовал,упорно генерит 1:1
Очень странно это,тем паче в Телеграме бот позволяет выбрать соотношение сторонЕщё и нагло врёт. :)


BazilioMike
28.04.2026 11:08Интересно как заставить редактор Изображения понять что нужно с высоты птичьего полета ракурс сделать как бы не просил все равно с земли делает ракурс и при генерации и при редактировании изображения:
A breathtaking bird’s-eye perspective of a sprawling post-apocalyptic crater, captured with a Hasselblad H6D and a 28mm wide-angle lens at f/8. Where once there was a lush resort, now lies a jagged architectural graveyard of twisted rebar and scorched concrete. A vibrant, toxic river of luminescent neon-teal chemical waste flows through the center, its surface churned into white foam by howling winds. The atmosphere is thick with heavy fog and swirling embers, creating a moody, epic chiaroscuro effect. Sharp, dramatic light pierces through the smog, illuminating the intricate debris and fine textures of rust and ash. The color palette is intensely vibrant, contrasting deep obsidian shadows with electric oranges and radioactive violets. Every detail is rendered with professional clarity, from the tattered remains of sky-bridge cables whipping in the gale to the cracked, parched earth of the surrounding desolation.
Kandinsky ===========
Эта правильная
Shedevrum 
yamabusi
28.04.2026 11:08Имхо не тут такие вопросы задавать,с уважением,это вопрос сугубо промтинга и только даже не касательно одной модели,зачем создателей на такие банальные вещи пытать.
Начните например с strictly top‑down и лучше с Perplexity на эту тему побеседуйте. ><
BazilioMike
28.04.2026 11:08

yamabusi
28.04.2026 11:08Ладно,лучше в Телеге бот,хотя там быстро дневной лимит вычерпывается.
У меня категорически не работает такой способ как вы выше написали.

yamabusi
28.04.2026 11:08Ещё раз вам говорю-это не Ошибка. ><
Я вам как пример привёл рандомный,что вы не можете с частботом перебрать иные варианты? Вы давно генерациями занимаетесь,я вам говорю,что эти лишь вопрос промтинга,кстати Большинство,особенно локальных по опыту тупят с видом сверху,а тут всё ок ещё. Зачем вы такой мелочёвкой их пытаетесь бесполезно озадачить. ;)
Лучше бы они турбо вариант локального Кандинского 5 выкатили или LoRA для меньших шагов,вот что полезнее весьма.
Nadir view, pure top-down orthographic aerial photograph of a city. NO perspective, NO vanishing point. Looking exactly straight down at highly detailed realistic textures: asphalt, concrete rooftops, cars. Flat lay photography style but of a huge city scale

yamabusi
28.04.2026 11:0860-degree top-down aerial photograph of a modern city, orthographic camera, zero tilt. Looking directly down at realistic building rooftops with AC units, solar panels, and antennae. Real shadows cast by objects, cars on the streets, people walking. High detail, photorealistic, raw drone photography, sunny day, deep textures


IamSVP
28.04.2026 11:08в примере «Убери граффити и надписи на стене» также пропала надпись на полу, т.е. была затронута нередактируемая область, ну либо модель не правильно поняла промпт

manyakRus
28.04.2026 11:08Спасибо авторам :-)
модель хорошо рисует русские буквы, лучше многих других ИИ
(ChatGPT ещё лучше, только меня туда не пускают даже с VPN)

Mishootk
28.04.2026 11:08Я могу сказать, что постобработка моего моего наброска до полиграфического варианта меня впечатлила. До этого не пользовался никакими улучшайзерами.




andreyft
28.04.2026 11:08Зашел. Модель пишет, что не имеет возможности редактирования вложенных изобрежений. Это как соотносится с тем, что здесь написано?

Mishootk
28.04.2026 11:08Я играл с моделью через макс, периодически отказывается обрабатывать предложенное изображение. Через час-другой точно такой же запрос обрабатывает. На профессиональное использование такого варианта не тянет, но чисто для себя поиграть - вполне достойно. Руками я все равно такой результат получил бы намного позже.

Emil290426
28.04.2026 11:08Когда ваша модель научиться нормально писать на русском языке? Это же позор какой то, даже китайские локальные модели уже умеют нормально писать на русском
для сравнения

Кандинский 6.0 Онлайн 
Ernie Image локально в ComfyUI 
Mishootk
28.04.2026 11:08Две левые китайские ноги вас смущают меньше чем текст. Если выбирать между текстом и картинкой, я бы жертвовал текстом, его можно и отдельно наложить. Но я соглашусь, что приятно, когда и текст тоже генерируется правильно.

DanilAi
28.04.2026 11:08Не понимаю, как у вас получается так «идеально редактировать и генерировать» но для пользователя ничего не изменилось в интернете про генерирований изображений не умеет, вот просто попросить пусть в моем селфи будет Раин Гослинг, то он генерирует совершенно иное просто сгенерированный персонаж который похож сильно на меня, попросил сделать так чтоб в моей комнате стояли «близняшки левая и правая из Atomic heart» сгенерировал совершенно другую комнату и то не близняшек а двух женщин и то в стиле цветных карандашей, это доказывает что kandinsky не умеет генерировать персонажей и объектов из «интернета» в то время когда у Chat GPT и других западных моделей таких проблем нет, скину пример редактированных фоток промнт писал на русском для обеих моделей


1 Kandinsky 6
2 ChatGPT
И много других вариантов пробовал ничего не поменялось, притом GigaChat пишет «вот добавил близняшек из Атомик харт в тебе в комнату» либо криво работает, либо поиск объектов или персонажей при генерации/редактирования не работает пока-что либо не знаю
Для меня как и многих загадка как вы ваще тестируете новую модель, когда как вы говорите «стоит на равне с передовыми моделями генераций/редактирования изображений» когда как если китайские модели, самые нишевые китайские бесплатные модели генерируют/редактируют 10 раз лучше чем Kandinsky 6 снова говорю для меня загадка как вы ваще тестируете если в постах социальных сетях реклама «генерирует как передовые модели» но когда сам пробуешь результат даже близко не похож

DanilAi
28.04.2026 11:08Kandinsky 6 прокачали чтоб изменять внешность хорошо, тип сделай волосы длиннее, сделай эльфийские уши, то есть самые «частые» запросы которые делает каждый второй, и можно сказать уровень редактирования как у Flex 2 max, но уровень как у image 2 ChatGPT отстает прям сильно особенно добавлять персонажей из «интернета» редактировать например что то убрать из фото модель уже может, ну а в плане генерации изображения тож прокачали теперь «лица» у людей нормальные и пять пальцев, а не шесть

fire64
Это все конечно хорошо, но когда вы уже научите свои модели рисовать текст на кириллице?
В боте в прошлом году она рисовала аброкадабру....
Почему иностранные модели и то на русском рисуют, а ваша отечественная нет? У Яндекс Арта та же проблема....
nikgerasimenko Автор
Здравствуйте! Короткие тексты (3-7 слов) Kandinsky генерит достаточно стабильно уже сейчас. В следующей версии модели планируем значительно усилить этот навык, вплоть до полноценной генерации инфографики.