Привет, Хабр! 27 июня в Москве прошла конференция GigaConf 2024, на которой эксперты Сбера и других ведущих компаний рассказали о развитии технологий искусственного интеллекта (AI) — в первую очередь для разработчиков. У Хабра здесь была своя медиастудия, где мы взяли несколько интервью с ключевыми спикерами.

Хабр пригласил меня тоже посетить GigaConf и сделать с конференции полноценный репортаж, поделиться живыми впечатлениями. А в процессе я ещё и пообщался с сотрудниками Сбера и других компаний, чтобы побольше узнать о свежих (и обновлённых) технологиях, которые меня заинтересовали. Всеми подробностями и впечатлениями о конференции делюсь под катом.

Мощные перспективы искусственного интеллекта

Солнечное июньское утро в креативном пространстве «Дизайн завод» прекрасно располагало к открытию конференции. Дух современных технологий витал по всему пространству. По территории прогуливается вот такой симпатичный робопёс. 

Робопёс
Робопёс

Насмотревшись на дога, я иду в основной зал конференции на…

Пленарный доклад

Пленарную часть открыл старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев. Он рассказал о вызовах, которые сейчас стоят перед специалистами по искусственному интеллекту и об успехах, которых удалось добиться разработчикам Сбера за последнее время.

«Очень часто наши клиенты даже не знают, что в наших решениях используются технологии искусственного интеллекта, однако без них представить клиентский опыт сейчас уже невозможно». Андрей отметил, что более 80% разработчиков, опрошенных Сбером, уже используют AI в личных проектах. Генеративные модели тестируют или уже внедрили 60% компаний. И что AI поможет повысить продуктивность в сфере разработки в ближайшие полтора года более чем на 20%.

Разработками самого Сбера пользуется множество компаний. Более четырёх тысяч бизнесов разных размеров внедрили у себя GigaChat. В том числе решение применяется в сложных кейсах: к примеру, Сибур интегрировал GigaChat в свои бизнес- и производственные процессы.

«AI вместе или вместо инженера?» Останутся ли айтишники без работы из-за AI? Продукты Сбера отвечают на оба вопроса: однозначно вместе. Сегодня до 25% кода сотрудники Сбера пишут с помощью AI-ассистента GigaCode, количество установок которого превысило 20 000. 

Отдельно Андрей отметил GigaIDE — собственную среду разработки Сбера: в ней работают все плагины, которыми привыкли пользоваться айтишники. В неё тоже встроен GigaCode.

В целом AI-продукты для айтишников Сбер развивает именно по запросам и обратной связи от целевой аудитории: выясняет, что нравится и не нравится инженерам, работающим с этими решениями, какие у них есть ещё незакрытые потребности.

Подводя итоги, Андрей отметил: «Верю, что в 2025 году не будет ни одного успешного приложения, написанного без AI». И этим задал тон всей конференции — именно развитию AI-технологий во всех сферах на ней уделили особое внимание. Сам Андрей больше рассказал о них в интервью на медиастудии Хабра.

Максут Шадаев и Андрей Белевцев на сцене во время пленарного доклада
Максут Шадаев и Андрей Белевцев на сцене во время пленарного доклада

Далее выступил министр цифрового развития, связи и массовых коммуникаций Российской Федерации Максут Шадаев. Он рассказал о самых сложных и амбициозных направлениях нацпроекта «Экономика данных и цифровая трансформация государства». Это развёртывание низкоорбитальной группировки спутников связи, внедрение облачных цифровых платформ во всех отраслях экономики вместо лоскутной цифровизации снизу и государственные сервисы на основе искусственного интеллекта. 

Гостья из Китая Сяомань Ху (Hu Xiaman), лидер сообщества MindSpore, рассказала о достижениях проекта в области развития AI-технологий: open-source-фреймворк помогает быстрее тренировать, файнтюнить и дебажить AI-модели. MindSpore выпустили уже более 20 фундаментальных моделей на GitHub, их используют около 40% китайских компаний, занятых в сфере искусственного интеллекта. Компания намерена выступать акселератором инноваций, следуя относительно малыми шагами к большому общему успеху для отрасли по всему миру.  

В конце пленарного доклада руководитель Управления экспериментальных систем машинного обучения SberDevices Сергей Марков поделился планами развития нейросетевой модели GigaChat. После его выступления я взял у Сергея небольшое интервью, чтобы узнать о GigaChat больше.

Сергей Марков. Безопасность AI и GigaChat

Сергей, расскажите о перспективах развития GigaChat. Какие нововведения ждут пользователей этого сервиса, какие основные векторы развития?

Планы у нас весьма обширные, в основном по следующим направлениям:

1) Дальнейшее усиление общего «интеллекта» модели — модель станет ещё «умнее», будут усовершенствованы механизмы RAG, увеличится длина контекста модели, что позволит ей более эффективно работать с большими документами. Также будет улучшена работа с функциями.

2) Мультимодальность — модель получит новые возможности для работы с изображениями, аудио и видео.

3) Мультиагентность — модель получит новые инструменты, появятся коннекторы с различными внешними системами: от мессенджеров до офисного ПО, будут усилены возможности модели в области построения рассуждений.

4) Развитие пользовательского опыта — от развития системы персонажей до разных интерфейсных улучшений (отрисовка графиков, выполнение кода, интерактивные инструменты работы с текстом и т. д.).

У вас огромный опыт работы с AI. Расскажите, какие угрозы или проблемы с безопасностью есть у инструментов разработки, использующих искусственный интеллект. Например, злоумышленники могут обучить нейросеть уязвимому коду, который затем будет предлагаться легальным разработчикам…

Конечно, массовое применение AI в разработке программного обеспечения несёт риски, которыми необходимо грамотно управлять. Специалисты по кибербезопасности рассматривают гипотетические сценарии, в которых злоумышленники могут осуществить инъекции в обучающую выборку моделей, используемых в разработке ПО, спровоцировав генерацию потенциально уязвимого или вредоносного кода.

Но важно понимать, что для этого требуется стечение множества обстоятельств: знания злоумышленниками того, какие именно источники используются для обучения (на практике обучающие данные проходят через жёсткие фильтры), наличие у организаторов атаки возможности производить инъекции, а также должен отсутствовать контроль генерируемого кода (на практике он всё равно просматривается разработчиками). Конечно, всё это не значит, что атаки такого рода совсем невозможны. Специалисты активно их изучают и разрабатывают соответствующие средства защиты. В целом такие сценарии мало добавляют к уже существующим угрозам инъекций в open-source-репозитории.

Можете дать прогноз, когда искусственный интеллект начнёт разрабатывать искусственный интеллект? Какие проблемы при этом возникнут?

В некоторой степени это происходит уже сейчас: различные техники нейросетевого поиска архитектур (Neural architecture search, NAS), AutoML, автоматизированного подбора гиперпараметров обучения уже стали стандартной частью стека технологий машинного обучения. Многие современные модели создавались с применением этих техник.

Скорее всего, вклад этих методов в создание новых моделей будет расти — по мере того, как сами эти методы будут становиться более совершенными. Что касается проблем, то основными лимитирующими факторами в развитии этих технологий являются дефицит вычислительных мощностей (любое метаобучение требует на порядок больше вычислительных ресурсов, чем само обучение) и ограниченный (пока что) эффект от применения таких методов (не всегда оптимальное поисковое пространство, трата вычислений на не самые перспективные гипотезы и т. д.). Но в целом я смотрю на развитие этого направления с оптимизмом и надеюсь, что системы AI в будущем помогут нам создавать всё более совершенные системы AI.

Аишный павильон

Сергей продолжил разговор о перспективах ИИ в медиастудии Хабра, а я осмотрелся на площадке конференции. После пленарной части начались выступления участников в потоках. Всего на GigaConf их было семь: Стратегии инновации, ML/AI, Системный анализ, Инструменты разработчика, Инженерия данных, Безопасность приложений и DevOps. Большинство площадок располагались в отдельных зданиях. 

Но доклады необязательно было слушать в зале. На территории пространства оборудовали площадь со сценой и большими экранами, где можно было устроиться в удобных мягких пуфах и смотреть выступления под открытым небом.

Меня особо заинтересовал расположившийся рядом со сценой павильон Сбера, где демонстрировались различные AI-продукты компании — большинство можно было протестировать или посмотреть наглядные демонстрации от разработчиков.

На входе встречал экран инструментом для генерации 3D-моделей. Участники конференции создавали с его помощью мускулистых миньонов, очень жирных котов и капибарби. Модели хоть и низкополигональные, но сразу готовые к экспорту в Blender.

Команда GigaChat показывала в павильоне, как искусственный интеллект работает с изображениями и текстом в разных ситуациях. Одна из ключевых рабочих целей сейчас — научить модель точно считывать и верно интерпретировать текст с изображений. Но примеры работы с картинками и текстами для конференции ребята подобрали скорее прикольные, по фану. 

Например, модель пыталась выяснить, кто чей хозяин на фотке айтишника с котом. Сперва дала верный ответ, но после повторного вопроса засомневалась и объявила: кот владеет айтишником. В принципе, недалеко от истины...

Библиотека GigaChain приоткрывала завесу над будущим рутинных задач в IT: два AI-агента на экране решали в автономном диалоге различные таски. Агент-менеджер генерил задачки с разными условиями («проанализируй-ка динамику сепулек в сепуляторе за квартал по моим вводным данным об объёмах и скорости сепуления») и кидал эти задачи в агента-исполнителя. А тот писал код, который поможет таск разрешить, да ещё и с чёткими комментариями в каждом блоке. Нейроменеджер проверял результаты, выявлял ошибки и требовал доработок — прямо как настоящий! 

Много кода
Много кода

С некоторыми задачками диалог заканчивался почти мгновенно: исполнитель с первого раза выдавал качественное решение и переходил к следующему таску. Иногда диалог затягивался, но в целом пара агентов справлялась — видимо, суля айтишникам будущего роль «менеджеров над менеджерами».

Рядом представляли уже известные посетителям пленарки GitVerse, GigaCode, а также платформу облачных технологий Platform V — портфолио продуктов для различных облачных задач, от СУБД до сервиса аутентификации. Изначально Сбер разрабатывал их для внутреннего использования, а затем расширил доступность для внешних клиентов.

Эти более серьёзные продукты «потрогать» было уже нельзя, поэтому я решил расспросить о них специалистов Сбера. И поговорил с Сергеем Шелепиным, рассказавшим подробнее о GigaCode.

Сергей Шелепин. GigaCode и его перспективы

Какие языки программирования и среды разработки поддерживает GigaCode сейчас и поддержка каких планируется?

На сегодняшний день мы поддерживаем больше 30 языков и больше 10 интегрированных сред разработки, хотя начинали мы всего с четырёх языков корпоративного стека. В дальнейшем хотим добиться того, чтобы любой разработчик мог работать на нашем стеке. 

Что касается поддержки IDE, то на сегодняшний день, как я уже упоминал, мы доступны в нескольких средах, таких как семейство IDE от JetBrains, VSCode, Jupyter Notebook, GigaIDE, хотим ещё выпустить поддержку JupyterLab. В дальнейшем планируем поддерживать наиболее популярные у разработчиков IDE.

Существует ли какой-то порог входа для GigaCode? Или AI-ассистентом может эффективно пользоваться как джун, так и сеньор?

Как такового порога нет. Вы как разработчик можете установить плагин, начать писать код и смотреть, как ассистент помогает в разработке, предлагает различные подсказки, которые вы можете принять и поправить, задавать вопросы в чат о разработке, девопсе и других полезных инструментах. 

Но здесь важно отметить, что ассистент — это инструмент из серии easy to learn, hard to master. Есть свои нюансы, но чтобы его использовать на полную мощность, нужно хорошо понимать, что вам нужно сделать.

GigaCode разрабатывался в помощь разработчикам. А есть ли функционал, полезный для реверсеров, исследующих код, вирусных аналитиков и багхантеров?

У нас есть возможность объяснения кода: когда вы можете получить словесное описание фрагмента кода на экране, это позволяет существенно ускорить анализ. Как известно, лучший баг — тот, который не случился. Поэтому GigaCode позволяет написать необходимые тесты для того, чтобы разработчики могли хорошо протестировать свой код и исключить наличие багов.

Эйчар-площадка и атмосфера на конференции

Про перспективы AI-ассистента разработчика Сергей рассказал на нашей медиастудии. А я решил посетить расположившуюся неподалёку от AI-павильона эйчар-площадку: специалисты Сбера проводили на ней карьерное консультирование. На площадке всегда было оживлённо, на стоявшей рядом стене оставили множество пожеланий, а в специальной группе в ТГ участники активно забивали слоты для консультаций.

Стена для подписей
Стена для подписей

Здесь не только работали, но и отдыхали — играли в айтишный элиас и 100 к 1. Я отправился дальше набираться впечатлений.

Неподалёку от большой сцены стояли аркадные автоматы: Пэкман, Punch-Out, третий Мортал Комбат. Слушатели вставали с мягких кресел, чтобы немного развлечься между докладами. В сочетании с открытой площадкой это придавало конфе весьма расслабленную атмосферу: здесь не просто все свои — здесь вообще не ждут от тебя какой-то формальности.

Похожая ситуация была на отдельной площадке Cloud.ru: компания приглашала поиграть в уно с айтишным флёром и ответить на викторину «Правда и мифы о Cloud.ru». За все активности бот в ТГ выдавал баллы, которые можно было обменять на мёрч или выпить за них айтишный (безалкогольный, конечно же) коктейль. Я настроился всерьёз послушать презентацию Cloud.ru о том, что же компания представляет на конференции. Но перед этим поймал на небольшую беседу Анатолия Шипова — управляющего директора СберТеха, лидера направления GitVerse. Он рассказал, какие задачи выполняют эти решения.

Анатолий Шипов. О GitVerse и GigaIDE

GigaIDE интегрируется только с GitVerse или возможны варианты интеграции с другими репозиториями? 

GigaIDE поддерживает ряд языков: Java, Python, JS, TypeScript и другие. Доступен в виде локальной установки, а также ведётся работа по интеграции с облаком и совместимости с GitVerse. 

Сегодня задача прописывания настроек Java и переменных окружения может потребовать выполнения инструкций на нескольких экранах. На всё разработчик тратит много времени. Но в нашем IDE за несколько секунд поднимается окружение, выполняется проброс портов и настройка параметров, причём всё это выполняется независимо от среды. 

Как мигрировать проекты с других площадок на GitVerse?

Если разработчику удобно работать в нашей среде, но при этом он не хочет терять своё комьюнити, например на Github, то он может настроить зеркало в несколько кликов и в GitHub польются изменения с нашего репозитория. Сейчас импорт и зеркалирование доступны в обе стороны. Дальше мы будем развивать возможности импорта и адаптеры к разным системам. При этом большой запрос есть по корпоративным системам с внутренними облаками. Нет проблемы и с доступностью регистрации на GitVerse без российского номера. Сейчас разработчики из других стран могут свободно пользоваться нашим репозиторием.

Расскажите подробнее о том, как AI ассистент помогает разработчикам писать код.

Очень часто технологии автоматизации и искусственный интеллект разработчики устанавливают, что называется, сбоку, в качестве такой дополнительной опции. Но мы строим платформу GitVerse таким образом, чтобы AI был доступен в любом инструменте, что позволяет сократить время на выполнение разработчиками рутинных задач. На этой конференции мы представили большое обновление, в котором усовершенствована языковая модель, имеется чат для взаимодействия с системой, короткие команды, частичное принятие подсказок и многое другое. 

Также добавлены две экспериментальные функции. Первая — code review: одна кнопка подготавливает ревью, подсвечивает основные вещи, стиль, логические элементы. Вторая функция — это оценка трудозатрат и аналитика. Можно спрогнозировать, сколько стоит разработать аналогичное приложение и сравнить трудозатраты. 

Марио в выгодном контейнере

За разговором мы с Анатолием как раз добрались до медиастудии Хабра, где он поделился ещё деталями о GitVerse. Я тем временем вернулся к мини-площадке Cloud.ru.

На стенде Cloud.ru — ноутбук, на экране — игра про Марио. Водопроводчик заключён в контейнер — один из множества в продукте Container Apps, который демонстрирует компания. Закрыв веб-страницу с игрой, разработчик показывает мне весь путь развёртки образа в новом контейнере. Технические детали и интерфейс понятны, накликать себе контейнер можно быстро и удобно, но главное, что цепляет моё внимание в Container Apps, — автоматическое масштабирование с мягкими и жёсткими ограничениями плюс оплата только за время активной работы контейнеров. 

Так решаются две проблемы. Разработчикам не нужно платить за постоянное нахождение в облаке сайта или сервиса, которым пользуются в месяц час от силы. И нет шансов однажды утром проснуться в адских долгах, потому что ночью был наплыв юзеров и тебе выставили счёт за нереальное количество контейнеров.

Пока мы обсуждаем, что это особенно удобно для небольших разработок и пет-проектов, развёртка успешно завершается — Марио снова на экране. Разработчик пытается найти клавиши управления, Марио перескакивает через черепаху, но проваливается в пропасть посередине уровня 1–1. Остаётся только посетовать: «Хотел спасти принцессу, но не в этот раз». За мной уже образовалась небольшая очередь, так что я даю другим участникам возможность оценить, счастлив ли водопроводчик в контейнере, а сам спешу на последнее сегодняшнее интервью — как раз со специалистом Cloud.ru.

Михаил Сайнуков. Проблемы технологической независимости

В последние два года вопросы импортозамещения и технологической независимости стоят в стране достаточно остро. На конференции эту тему раскрыл в своём выступлении Михаил Сайнуков из Cloud.ru. Мне в беседе он поделился своим видением проблем технологической независимости.

Для каких отраслей вы рассматриваете использование технологической платформы для достижения технологического суверенитета?

Любые компании используют IT, с помощью чего напрямую осуществляется бизнес или технологии берут на себя необходимую вспомогательную функцию, напрямую влияющую на бизнес. Создание такой платформы наиболее актуально любым крупным компаниям, которые обладают собственным парком вычислительного оборудования, предпочитают самостоятельно управлять инфраструктурой, хотят или уже активно пробуют новые технологии, а также ведут разработку чего-то нового для себя или для рынка.

Многие современные решения по импортозамещению базируются на использовании готовых решений с открытым кодом и минимальными дополнениями. Насколько, по-вашему, это правильный путь? Не попадём ли мы таким образом в скрытую зависимость от иностранных решений? Например, как в случае с блокировкой доступа к Docker Hub.

Cloud.ru ещё на этапе планирования принял для себя стратегию максимально возможной собственной разработки элементов решения. Всё, что мы берём извне, проходит жёсткие проверки на работоспособность под промышленными нагрузками, а также на чистоту исходного кода и используемых зависимостей. Планируя взять что-то к себе «на борт», мы полностью уверены в том, что знаем, как оно сделано и работает, что можем самостоятельно модифицировать компонент, добавлять новую функциональность и поддерживать бесперебойную работоспособность. Если же существующие open-source-решения нас не удовлетворяют, мы разрабатываем свои. Пример — программно-определяемое хранилище. Мы не взяли уже знакомый многим Ceph или Gluster, а c нуля разработали собственный SDS на базе метода erasure-coding.

Как видоизменились IT-процессы в российских компаниях после начала событий 2022 года? В связи с импортозамещением они также переориентировались на отечественные методологии?

Ввиду того что нужно искать и тестировать отечественные решения и новые технологии, компаниям критически важно быть гибкими и уметь работать с различным «непрофильным» ПО: оркестраторы контейнеров, NoSQL-базы данных, распределённые кеши, брокеры сообщений и т. п. Зачем? Чтобы максимально быстро уметь тестировать те самые отечественные решения и новые технологии. Ведь зачастую они базируются на этом «фундаменте». Кроме того, важно иметь прозрачность на уровне вычислительной инфраструктуры, чтобы всегда уметь ответить на вопрос: «А как мы утилизируем наше железо?» и иметь возможность динамически работать с ресурсами, быстро выделяя песочницы для тестирования и разработки внутренних инициатив и продуктов.

GigaConf с высоты птичьего полёта (ну почти)
GigaConf с высоты птичьего полёта (ну почти)

Заключение

День клонится к вечеру. На уличной сцене уже начинают звучать «Дожди-пистолеты» от «Зверей», а я потихоньку двигаюсь к выходу с «Дизайн завода». 

Наверное, эта прогулка и отражает лучше всего моё неформальное впечатление о конференции. Это было интересно как возможность заглянуть в будущее IT. Можно было увидеть, как технологии искусственного интеллекта уже сейчас реально меняют и привычный процесс разработки приложений, и сами инструменты для разработчиков. Круто, что бигтехи проводят такие конференции, и я надеюсь, что их частота и количество будет расти. Нам есть что рассказать — как внутри, так и миру. До новых встреч!

Привет, Хабр! 27 июня в Москве прошла конференция GigaConf 2024, на которой эксперты Сбера и других ведущих компаний рассказали о развитии технологий искусственного интеллекта (AI) — в первую очередь для разработчиков. У Хабра здесь была своя медиастудия, где мы взяли несколько интервью с ключевыми спикерами.

Хабр пригласил меня тоже посетить GigaConf и сделать с конференции полноценный репортаж, поделиться живыми впечатлениями. А в процессе я ещё и пообщался с сотрудниками Сбера и других компаний, чтобы побольше узнать о свежих (и обновлённых) технологиях, которые меня заинтересовали. Всеми подробностями и впечатлениями о конференции делюсь под катом.

Мощные перспективы искусственного интеллекта

Солнечное июньское утро в креативном пространстве «Дизайн завод» прекрасно располагало к открытию конференции. Дух современных технологий витал по всему пространству. По территории прогуливается вот такой симпатичный робопёс. 

Робопёс
Робопёс

Насмотревшись на дога, я иду в основной зал конференции на…

Пленарный доклад

Пленарную часть открыл старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев. Он рассказал о вызовах, которые сейчас стоят перед специалистами по искусственному интеллекту и об успехах, которых удалось добиться разработчикам Сбера за последнее время.

«Очень часто наши клиенты даже не знают, что в наших решениях используются технологии искусственного интеллекта, однако без них представить клиентский опыт сейчас уже невозможно». Андрей отметил, что более 80% разработчиков, опрошенных Сбером, уже используют AI в личных проектах. Генеративные модели тестируют или уже внедрили 60% компаний. И что AI поможет повысить продуктивность в сфере разработки в ближайшие полтора года более чем на 20%.

Разработками самого Сбера пользуется множество компаний. Более четырёх тысяч бизнесов разных размеров внедрили у себя GigaChat. В том числе решение применяется в сложных кейсах: к примеру, Сибур интегрировал GigaChat в свои бизнес- и производственные процессы.

«AI вместе или вместо инженера?» Останутся ли айтишники без работы из-за AI? Продукты Сбера отвечают на оба вопроса: однозначно вместе. Сегодня до 25% кода сотрудники Сбера пишут с помощью AI-ассистента GigaCode, количество установок которого превысило 20 000. 

Отдельно Андрей отметил GigaIDE — собственную среду разработки Сбера: в ней работают все плагины, которыми привыкли пользоваться айтишники. В неё тоже встроен GigaCode.

В целом AI-продукты для айтишников Сбер развивает именно по запросам и обратной связи от целевой аудитории: выясняет, что нравится и не нравится инженерам, работающим с этими решениями, какие у них есть ещё незакрытые потребности.

Подводя итоги, Андрей отметил: «Верю, что в 2025 году не будет ни одного успешного приложения, написанного без AI». И этим задал тон всей конференции — именно развитию AI-технологий во всех сферах на ней уделили особое внимание. Сам Андрей больше рассказал о них в интервью на медиастудии Хабра.

Максут Шадаев и Андрей Белевцев на сцене во время пленарного доклада
Максут Шадаев и Андрей Белевцев на сцене во время пленарного доклада

Далее выступил министр цифрового развития, связи и массовых коммуникаций Российской Федерации Максут Шадаев. Он рассказал о самых сложных и амбициозных направлениях нацпроекта «Экономика данных и цифровая трансформация государства». Это развёртывание низкоорбитальной группировки спутников связи, внедрение облачных цифровых платформ во всех отраслях экономики вместо лоскутной цифровизации снизу и государственные сервисы на основе искусственного интеллекта. 

Гостья из Китая Сяомань Ху (Hu Xiaman), лидер сообщества MindSpore, рассказала о достижениях проекта в области развития AI-технологий: open-source-фреймворк помогает быстрее тренировать, файнтюнить и дебажить AI-модели. MindSpore выпустили уже более 20 фундаментальных моделей на GitHub, их используют около 40% китайских компаний, занятых в сфере искусственного интеллекта. Компания намерена выступать акселератором инноваций, следуя относительно малыми шагами к большому общему успеху для отрасли по всему миру.  

В конце пленарного доклада руководитель Управления экспериментальных систем машинного обучения SberDevices Сергей Марков поделился планами развития нейросетевой модели GigaChat. После его выступления я взял у Сергея небольшое интервью, чтобы узнать о GigaChat больше.

Сергей Марков. Безопасность AI и GigaChat

Сергей, расскажите о перспективах развития GigaChat. Какие нововведения ждут пользователей этого сервиса, какие основные векторы развития?

Планы у нас весьма обширные, в основном по следующим направлениям:

1) Дальнейшее усиление общего «интеллекта» модели — модель станет ещё «умнее», будут усовершенствованы механизмы RAG, увеличится длина контекста модели, что позволит ей более эффективно работать с большими документами. Также будет улучшена работа с функциями.

2) Мультимодальность — модель получит новые возможности для работы с изображениями, аудио и видео.

3) Мультиагентность — модель получит новые инструменты, появятся коннекторы с различными внешними системами: от мессенджеров до офисного ПО, будут усилены возможности модели в области построения рассуждений.

4) Развитие пользовательского опыта — от развития системы персонажей до разных интерфейсных улучшений (отрисовка графиков, выполнение кода, интерактивные инструменты работы с текстом и т. д.).

У вас огромный опыт работы с AI. Расскажите, какие угрозы или проблемы с безопасностью есть у инструментов разработки, использующих искусственный интеллект. Например, злоумышленники могут обучить нейросеть уязвимому коду, который затем будет предлагаться легальным разработчикам…

Конечно, массовое применение AI в разработке программного обеспечения несёт риски, которыми необходимо грамотно управлять. Специалисты по кибербезопасности рассматривают гипотетические сценарии, в которых злоумышленники могут осуществить инъекции в обучающую выборку моделей, используемых в разработке ПО, спровоцировав генерацию потенциально уязвимого или вредоносного кода.

Но важно понимать, что для этого требуется стечение множества обстоятельств: знания злоумышленниками того, какие именно источники используются для обучения (на практике обучающие данные проходят через жёсткие фильтры), наличие у организаторов атаки возможности производить инъекции, а также должен отсутствовать контроль генерируемого кода (на практике он всё равно просматривается разработчиками). Конечно, всё это не значит, что атаки такого рода совсем невозможны. Специалисты активно их изучают и разрабатывают соответствующие средства защиты. В целом такие сценарии мало добавляют к уже существующим угрозам инъекций в open-source-репозитории.

Можете дать прогноз, когда искусственный интеллект начнёт разрабатывать искусственный интеллект? Какие проблемы при этом возникнут?

В некоторой степени это происходит уже сейчас: различные техники нейросетевого поиска архитектур (Neural architecture search, NAS), AutoML, автоматизированного подбора гиперпараметров обучения уже стали стандартной частью стека технологий машинного обучения. Многие современные модели создавались с применением этих техник.

Скорее всего, вклад этих методов в создание новых моделей будет расти — по мере того, как сами эти методы будут становиться более совершенными. Что касается проблем, то основными лимитирующими факторами в развитии этих технологий являются дефицит вычислительных мощностей (любое метаобучение требует на порядок больше вычислительных ресурсов, чем само обучение) и ограниченный (пока что) эффект от применения таких методов (не всегда оптимальное поисковое пространство, трата вычислений на не самые перспективные гипотезы и т. д.). Но в целом я смотрю на развитие этого направления с оптимизмом и надеюсь, что системы AI в будущем помогут нам создавать всё более совершенные системы AI.

Аишный павильон

Сергей продолжил разговор о перспективах ИИ в медиастудии Хабра, а я осмотрелся на площадке конференции. После пленарной части начались выступления участников в потоках. Всего на GigaConf их было семь: Стратегии инновации, ML/AI, Системный анализ, Инструменты разработчика, Инженерия данных, Безопасность приложений и DevOps. Большинство площадок располагались в отдельных зданиях. 

Но доклады необязательно было слушать в зале. На территории пространства оборудовали площадь со сценой и большими экранами, где можно было устроиться в удобных мягких пуфах и смотреть выступления под открытым небом.

Меня особо заинтересовал расположившийся рядом со сценой павильон Сбера, где демонстрировались различные AI-продукты компании — большинство можно было протестировать или посмотреть наглядные демонстрации от разработчиков.

На входе встречал экран инструментом для генерации 3D-моделей. Участники конференции создавали с его помощью мускулистых миньонов, очень жирных котов и капибарби. Модели хоть и низкополигональные, но сразу готовые к экспорту в Blender.

Команда GigaChat показывала в павильоне, как искусственный интеллект работает с изображениями и текстом в разных ситуациях. Одна из ключевых рабочих целей сейчас — научить модель точно считывать и верно интерпретировать текст с изображений. Но примеры работы с картинками и текстами для конференции ребята подобрали скорее прикольные, по фану. 

Например, модель пыталась выяснить, кто чей хозяин на фотке айтишника с котом. Сперва дала верный ответ, но после повторного вопроса засомневалась и объявила: кот владеет айтишником. В принципе, недалеко от истины...

Библиотека GigaChain приоткрывала завесу над будущим рутинных задач в IT: два AI-агента на экране решали в автономном диалоге различные таски. Агент-менеджер генерил задачки с разными условиями («проанализируй-ка динамику сепулек в сепуляторе за квартал по моим вводным данным об объёмах и скорости сепуления») и кидал эти задачи в агента-исполнителя. А тот писал код, который поможет таск разрешить, да ещё и с чёткими комментариями в каждом блоке. Нейроменеджер проверял результаты, выявлял ошибки и требовал доработок — прямо как настоящий! 

Много кода
Много кода

С некоторыми задачками диалог заканчивался почти мгновенно: исполнитель с первого раза выдавал качественное решение и переходил к следующему таску. Иногда диалог затягивался, но в целом пара агентов справлялась — видимо, суля айтишникам будущего роль «менеджеров над менеджерами».

Рядом представляли уже известные посетителям пленарки GitVerse, GigaCode, а также платформу облачных технологий Platform V — портфолио продуктов для различных облачных задач, от СУБД до сервиса аутентификации. Изначально Сбер разрабатывал их для внутреннего использования, а затем расширил доступность для внешних клиентов.

Эти более серьёзные продукты «потрогать» было уже нельзя, поэтому я решил расспросить о них специалистов Сбера. И поговорил с Сергеем Шелепиным, рассказавшим подробнее о GigaCode.

Сергей Шелепин. GigaCode и его перспективы

Какие языки программирования и среды разработки поддерживает GigaCode сейчас и поддержка каких планируется?

На сегодняшний день мы поддерживаем больше 30 языков и больше 10 интегрированных сред разработки, хотя начинали мы всего с четырёх языков корпоративного стека. В дальнейшем хотим добиться того, чтобы любой разработчик мог работать на нашем стеке. 

Что касается поддержки IDE, то на сегодняшний день, как я уже упоминал, мы доступны в нескольких средах, таких как семейство IDE от JetBrains, VSCode, Jupyter Notebook, GigaIDE, хотим ещё выпустить поддержку JupyterLab. В дальнейшем планируем поддерживать наиболее популярные у разработчиков IDE.

Существует ли какой-то порог входа для GigaCode? Или AI-ассистентом может эффективно пользоваться как джун, так и сеньор?

Как такового порога нет. Вы как разработчик можете установить плагин, начать писать код и смотреть, как ассистент помогает в разработке, предлагает различные подсказки, которые вы можете принять и поправить, задавать вопросы в чат о разработке, девопсе и других полезных инструментах. 

Но здесь важно отметить, что ассистент — это инструмент из серии easy to learn, hard to master. Есть свои нюансы, но чтобы его использовать на полную мощность, нужно хорошо понимать, что вам нужно сделать.

GigaCode разрабатывался в помощь разработчикам. А есть ли функционал, полезный для реверсеров, исследующих код, вирусных аналитиков и багхантеров?

У нас есть возможность объяснения кода: когда вы можете получить словесное описание фрагмента кода на экране, это позволяет существенно ускорить анализ. Как известно, лучший баг — тот, который не случился. Поэтому GigaCode позволяет написать необходимые тесты для того, чтобы разработчики могли хорошо протестировать свой код и исключить наличие багов.

Эйчар-площадка и атмосфера на конференции

Про перспективы AI-ассистента разработчика Сергей рассказал на нашей медиастудии. А я решил посетить расположившуюся неподалёку от AI-павильона эйчар-площадку: специалисты Сбера проводили на ней карьерное консультирование. На площадке всегда было оживлённо, на стоявшей рядом стене оставили множество пожеланий, а в специальной группе в ТГ участники активно забивали слоты для консультаций.

Стена для подписей
Стена для подписей

Здесь не только работали, но и отдыхали — играли в айтишный элиас и 100 к 1. Я отправился дальше набираться впечатлений.

Неподалёку от большой сцены стояли аркадные автоматы: Пэкман, Punch-Out, третий Мортал Комбат. Слушатели вставали с мягких кресел, чтобы немного развлечься между докладами. В сочетании с открытой площадкой это придавало конфе весьма расслабленную атмосферу: здесь не просто все свои — здесь вообще не ждут от тебя какой-то формальности.

Похожая ситуация была на отдельной площадке Cloud.ru: компания приглашала поиграть в уно с айтишным флёром и ответить на викторину «Правда и мифы о Cloud.ru». За все активности бот в ТГ выдавал баллы, которые можно было обменять на мёрч или выпить за них айтишный (безалкогольный, конечно же) коктейль. Я настроился всерьёз послушать презентацию Cloud.ru о том, что же компания представляет на конференции. Но перед этим поймал на небольшую беседу Анатолия Шипова — управляющего директора СберТеха, лидера направления GitVerse. Он рассказал, какие задачи выполняют эти решения.

Анатолий Шипов. О GitVerse и GigaIDE

GigaIDE интегрируется только с GitVerse или возможны варианты интеграции с другими репозиториями? 

GigaIDE поддерживает ряд языков: Java, Python, JS, TypeScript и другие. Доступен в виде локальной установки, а также ведётся работа по интеграции с облаком и совместимости с GitVerse. 

Сегодня задача прописывания настроек Java и переменных окружения может потребовать выполнения инструкций на нескольких экранах. На всё разработчик тратит много времени. Но в нашем IDE за несколько секунд поднимается окружение, выполняется проброс портов и настройка параметров, причём всё это выполняется независимо от среды. 

Как мигрировать проекты с других площадок на GitVerse?

Если разработчику удобно работать в нашей среде, но при этом он не хочет терять своё комьюнити, например на Github, то он может настроить зеркало в несколько кликов и в GitHub польются изменения с нашего репозитория. Сейчас импорт и зеркалирование доступны в обе стороны. Дальше мы будем развивать возможности импорта и адаптеры к разным системам. При этом большой запрос есть по корпоративным системам с внутренними облаками. Нет проблемы и с доступностью регистрации на GitVerse без российского номера. Сейчас разработчики из других стран могут свободно пользоваться нашим репозиторием.

Расскажите подробнее о том, как AI ассистент помогает разработчикам писать код.

Очень часто технологии автоматизации и искусственный интеллект разработчики устанавливают, что называется, сбоку, в качестве такой дополнительной опции. Но мы строим платформу GitVerse таким образом, чтобы AI был доступен в любом инструменте, что позволяет сократить время на выполнение разработчиками рутинных задач. На этой конференции мы представили большое обновление, в котором усовершенствована языковая модель, имеется чат для взаимодействия с системой, короткие команды, частичное принятие подсказок и многое другое. 

Также добавлены две экспериментальные функции. Первая — code review: одна кнопка подготавливает ревью, подсвечивает основные вещи, стиль, логические элементы. Вторая функция — это оценка трудозатрат и аналитика. Можно спрогнозировать, сколько стоит разработать аналогичное приложение и сравнить трудозатраты. 

Марио в выгодном контейнере

За разговором мы с Анатолием как раз добрались до медиастудии Хабра, где он поделился ещё деталями о GitVerse. Я тем временем вернулся к мини-площадке Cloud.ru.

На стенде Cloud.ru — ноутбук, на экране — игра про Марио. Водопроводчик заключён в контейнер — один из множества в продукте Container Apps, который демонстрирует компания. Закрыв веб-страницу с игрой, разработчик показывает мне весь путь развёртки образа в новом контейнере. Технические детали и интерфейс понятны, накликать себе контейнер можно быстро и удобно, но главное, что цепляет моё внимание в Container Apps, — автоматическое масштабирование с мягкими и жёсткими ограничениями плюс оплата только за время активной работы контейнеров. 

Так решаются две проблемы. Разработчикам не нужно платить за постоянное нахождение в облаке сайта или сервиса, которым пользуются в месяц час от силы. И нет шансов однажды утром проснуться в адских долгах, потому что ночью был наплыв юзеров и тебе выставили счёт за нереальное количество контейнеров.

Пока мы обсуждаем, что это особенно удобно для небольших разработок и пет-проектов, развёртка успешно завершается — Марио снова на экране. Разработчик пытается найти клавиши управления, Марио перескакивает через черепаху, но проваливается в пропасть посередине уровня 1–1. Остаётся только посетовать: «Хотел спасти принцессу, но не в этот раз». За мной уже образовалась небольшая очередь, так что я даю другим участникам возможность оценить, счастлив ли водопроводчик в контейнере, а сам спешу на последнее сегодняшнее интервью — как раз со специалистом Cloud.ru.

Михаил Сайнуков. Проблемы технологической независимости

В последние два года вопросы импортозамещения и технологической независимости стоят в стране достаточно остро. На конференции эту тему раскрыл в своём выступлении Михаил Сайнуков из Cloud.ru. Мне в беседе он поделился своим видением проблем технологической независимости.

Для каких отраслей вы рассматриваете использование технологической платформы для достижения технологического суверенитета?

Любые компании используют IT, с помощью чего напрямую осуществляется бизнес или технологии берут на себя необходимую вспомогательную функцию, напрямую влияющую на бизнес. Создание такой платформы наиболее актуально любым крупным компаниям, которые обладают собственным парком вычислительного оборудования, предпочитают самостоятельно управлять инфраструктурой, хотят или уже активно пробуют новые технологии, а также ведут разработку чего-то нового для себя или для рынка.

Многие современные решения по импортозамещению базируются на использовании готовых решений с открытым кодом и минимальными дополнениями. Насколько, по-вашему, это правильный путь? Не попадём ли мы таким образом в скрытую зависимость от иностранных решений? Например, как в случае с блокировкой доступа к Docker Hub.

Cloud.ru ещё на этапе планирования принял для себя стратегию максимально возможной собственной разработки элементов решения. Всё, что мы берём извне, проходит жёсткие проверки на работоспособность под промышленными нагрузками, а также на чистоту исходного кода и используемых зависимостей. Планируя взять что-то к себе «на борт», мы полностью уверены в том, что знаем, как оно сделано и работает, что можем самостоятельно модифицировать компонент, добавлять новую функциональность и поддерживать бесперебойную работоспособность. Если же существующие open-source-решения нас не удовлетворяют, мы разрабатываем свои. Пример — программно-определяемое хранилище. Мы не взяли уже знакомый многим Ceph или Gluster, а c нуля разработали собственный SDS на базе метода erasure-coding.

Как видоизменились IT-процессы в российских компаниях после начала событий 2022 года? В связи с импортозамещением они также переориентировались на отечественные методологии?

Ввиду того что нужно искать и тестировать отечественные решения и новые технологии, компаниям критически важно быть гибкими и уметь работать с различным «непрофильным» ПО: оркестраторы контейнеров, NoSQL-базы данных, распределённые кеши, брокеры сообщений и т. п. Зачем? Чтобы максимально быстро уметь тестировать те самые отечественные решения и новые технологии. Ведь зачастую они базируются на этом «фундаменте». Кроме того, важно иметь прозрачность на уровне вычислительной инфраструктуры, чтобы всегда уметь ответить на вопрос: «А как мы утилизируем наше железо?» и иметь возможность динамически работать с ресурсами, быстро выделяя песочницы для тестирования и разработки внутренних инициатив и продуктов.

GigaConf с высоты птичьего полёта (ну почти)
GigaConf с высоты птичьего полёта (ну почти)

Заключение

День клонится к вечеру. На уличной сцене уже начинают звучать «Дожди-пистолеты» от «Зверей», а я потихоньку двигаюсь к выходу с «Дизайн завода». 

Наверное, эта прогулка и отражает лучше всего моё неформальное впечатление о конференции. Это было интересно как возможность заглянуть в будущее IT. Можно было увидеть, как технологии искусственного интеллекта уже сейчас реально меняют и привычный процесс разработки приложений, и сами инструменты для разработчиков. Круто, что бигтехи проводят такие конференции, и я надеюсь, что их частота и количество будет расти. Нам есть что рассказать — как внутри, так и миру. До новых встреч!

Комментарии (2)


  1. JerryI
    20.07.2024 15:52

    Так разрабатывают, что до сих пор не получили Apple Developer ID и открыть GigaIDE без обходных путей на маке не выйдет…


    1. Mike_666
      20.07.2024 15:52

      Как они его могут получить находясь в sdn list?