Я руковожу практикой машинного обучения Центра компетенций больших данных и искусственного интеллекта в ЛАНИТ. Также под моим началом трудится команда ИИ-платформы для управления корпоративным искусственным интеллектом LANDEV AI. Мы занимаемся ML и AI уже больше пяти лет, поддерживаем другие бизнес-подразделения группы компаний в этой области. Когда я ехал в Белград на конференцию OpenTalks AI 2026, я преследовал сразу две цели: презентовать собственное решение, а также понять, какие актуальные темы можно применить на практике в наших проектах. Ну и, конечно, пообщаться с коллегами, которые сейчас разбросаны по всему миру.

Сегодня я бы хотел рассказать о впечатлениях от поездки, о докладах, которые запомнились мне больше всего, и поделиться мыслями, которые я представил участникам мероприятия в своем выступлении. 

OpenTalks.AI: взгляд изнутри

Конференция OpenTalks.AI – это независимая международная встреча AI/ML-специалистов. Впервые она состоялась в 2018 году. Тогда участие в ней приняли около 600 человек. Сейчас мероприятие собирает на своей площадке более 1000 экспертов и объединяет сообщество из 5000+ профессионалов.

Источник

С 2023 года OpenTalks стала главной точкой сбора русскоязычного AI/ML-сообщества. Формат уже стал привычным: два дня, три трека (бизнес, R&D, академическая наука). Спикеры проходят через систему Call for Proposals – никаких платных выступлений, только реальный отбор. 

В этом году конференция состояла из четырех блоков: 

  • AI-агенты, 

  • LLM (Large Language Model — большая языковая модель), 

  • GenAI (генеративный искусственный интеллект), 

  • RL (Reinforcement Learning, обучение с подкреплением – раздел машинного обучения, где искусственный интеллект обучается методом проб и ошибок). 

В каждом блоке – несколько сессий и ключевой доклад на главной сцене.

Я участвовал в OpenTalks и раньше – в 2020, 2021, 2022 годах. Отмечу, что конференция трансформируется вместе с технологиями. Теперь помимо технических докладов про новинки в программе появились и философские темы. Например, в этом году я послушал доклады о теориях цифрового самосознания и о том, возможно ли оно в будущем. 

Мой доклад: от проектов к продукту LANDEV AI 

Я выступал с докладом на тему «От проектов к продукту: как мы систематизировали работу с языковыми моделями». Хотел честно рассказать о том, как мы в ЛАНИТ пытались выбраться из бесконечного цикла «пресейл – пилот – внедрение». Коротко о том, что было в моем выступлении.

Я во время выступления. Источник
Я во время выступления. Источник

Мир до систематизации. В этой части я рассказал о том, как выглядела наша реальность поначалу. Было это так: больше 100 пресейлов в год с конверсией в 5-10%. При этом большинство ИИ-проектов не доходили до внедрения, а те, что доходили, требовали промышленной разработки с нуля и значительных инвестиций.

Заказчики в этот период попадались совершенно разные. Уверенные заявляли: «Спасибо, что помогли поверить в технологии, а дальше мы пойдем строить сами». Скептики, наоборот, говорили, что подтвердили свою гипотезу о том, что AI не работает. Встречались и фанатики, которые были готовы бросаться в проекты с головой под лозунгом: «Попробовали на паре кейсов. Теперь верим, что все будет идеально». Ленивые заказчики оставались при мнении, что ChatGPT – это магия, он решит все, даже задачи, где AI вообще не нужен. А новички обращались с предсказуемым запросом: «У нас есть бюджет на AI. Помогите начать».

Что изменилось с приходом LLM. С LLM задачи стали меньше зависеть от данных, а ключевым фактором мы теперь считаем контекст и платформенный подход LANDEV AI. 

Простой пример – это RAG (Retrieval-Augmented Generation, генерация с дополненной выборкой), технология в искусственном интеллекте, позволяющая нейросетям искать нужную информацию во внешних базах перед ответом. Вне зависимости от бизнес-задачи «набор холостяка» для нее не меняется: предобработка текста, полнотекстовый и векторный поиск, реранжирование, инструменты для доступа к API. Все это можно применить и для службы поддержки, и для юриста, хотя каждый раз конфигурация может быть разная. Сложный вариант – это цепочка «STT (Speech to text) → Web Agent → SGR (Schema guided reasoning) → внешняя система». Такой набор компонент может быть полезен если вы рекрутер (HR) и хотите после созвона с ресурсным менеджером по вакансии транскрибировать запись, сходить поискать похожие предложения в интернете, сформировать карточку вакансии, заполнить нужные для публикации поля и затем опубликовать по API (Application Programming Interface, программный интерфейс, позволяющий приложениям общаться между собой). Или вы маркетолог и пишете статью после интервью с CEO: транскрибируете, ищете дополнительный материал в сети, создаете карточку новости и публикуете.

В обоих примерах ключевыми компонентами становятся унифицированный доступ к моделям, мониторинг и трассировка, переиспользование ассистентов, управление затратами и безопасностью, а также инструменты для быстрого запуска прототипов и сбора обратной связи. Данные, конечно же, остаются важны и в особенности для тестирования, адаптации, внедрения, но не являются ключевым драйвером задачи.

Но это только часть решения: при наличии платформы, но без изменения процессов мы продолжаем каждый раз начинать с нуля. Новая задача равно новые усилия, процесс промышленного внедрения остается болезненным.

Один из слайдов моей презентации
Один из слайдов моей презентации

Как мы стали строить платформу. Мы начали собирать общий фундамент. Теперь на пресейле мы используем готовые блоки: LLM/VLM (большая языковая модель + визуально-языковая модель), STT (Speech-to-Text, распознавание речи), OCR (Optical Character Recognition, оптическое распознавание символов), упомянутая RAG и MCP (Model Context Protocol, протокол контекста модели). 

Результат этих действий в том, что из каждой неудачи (пресейл не перешел в пилот или пилот не перешел во внедрение) мы извлекаем полезные фичи, которые переиспользуем в следующих проектах. Если же этап был успешным, то получившийся в рамках пресейла/пилота сервис сразу включает готовые API, единый мониторинг, инструменты для настройки экспертами, балансировку и легкую смену моделей.

Про экономику и агентов. Отдельная история – это оптимизация затрат на LLM. Если всякий раз делать сервис для каждой редкой задачи, будет очень дорого. Есть много классных задач для HR, юристов, аудиторов, но каждым инструментом для них в отдельности будут пользоваться около ста раз в неделю. Это не оправдывает закупку и поддержку дорогого железа, организацию инфраструктуры и т.п. Именно поэтому мы в рамках платформы создали единую точку входа в инфраструктуру, которая распределяется между HR, поддержкой, юристами, аналитикой и другими отделами. В условиях, когда данные почти всегда несовершенны, требования меняются, а стоимость ошибок высока, важнее быстро проверять гипотезы, чем бесконечно шлифовать качество. Платформа позволяет сократить время от идеи до результата с месяцев до дней.

Вкратце все. Теперь поговорим о докладах на конференции, которые запомнились больше всего.

AI-ученый: когда модели сами делают науку

Открывала конференцию Татьяна Шаврина, руководитель группы научных сотрудников Llama, которая посвятила десять лет исследованиям и разработке LLM и инструментов обработки естественного языка (NLP), с докладом про AI-scientists (ИИ-ученых) – агентов, способных самостоятельно проводить исследования.

По словам спикера, модели уже вполне прилично решают задачи с Kaggle. Классические академические датасеты – без проблем. Существуют и бенчмарки, в первую очередь MLE-bench (комплексный набор тестов, оценивающий способность ИИ-агентов к автономной ML-инженерии), хотя есть обоснованные опасения, что модели постепенно «выучивают» эти задачи. Татьяна рассказала, что сейчас появляются новые бенчмарки в разных областях науки – социологии, биологии и других.

Из интересных идей – Darwin Gödel Machine (DGM), совместная разработка японской Sakana AI и лаборатории Джеффа Клюна в Университете Британской Колумбии. Речь о подходе к самомодификации моделей, который Татьяна упоминала как перспективное направление. В отличие от теоретической Gödel Machine Шмидхубера, требовавшей формальных доказательств полезности каждого изменения, DGM – это самомодифицирующийся coding-агент, который эмпирически валидирует собственные правки через бенчмарки.

Но главное, о чем говорила спикер, при всех замечательных новых возможностях, есть и новые проблемы.

Проблема ревью. Крупные конференции уже сейчас наводняются сгенерированными статьями. Возможности людей их рецензировать – это узкое горлышко, которое не масштабируется.

Проблема воспроизводимости. В психологии только около 39% опубликованных экспериментов можно воспроизвести. Отсюда идея – натравить AI-агентов именно на проверку воспроизводимости статей. Неважно, кем и как написана статья, важно – можно ли повторить результат.

Это кажется мне одним из самых ценных применений AI-ученых: не генерация новых статей, а верификация уже существующих.

Технологии, которые изменят все: взгляд Юрия Визельтера

Завершал первый день доклад Юрия Валентиновича Визельтера, доктора наук, профессора РАН, научного директора Института искусственного интеллекта МФТИ, директора по ИИ и компьютерному зрению Государственного научно-исследовательского института авиационных систем (ГосНИИАС), председателя Научного совета Российской ассоциации ИИ (РАИИ). Его рассказ был разбит на три части.

Первая часть доклада – это повествование о трех аспектах нашей сегодняшней реальности. 

1. Как мы работаем. Агенты прогрессируют быстро и могут решать все более сложные задачи. AI в обучении и науке постоянно открывает больше возможностей.

2. Как мы живем. Генерация видео, изображений, аудио уже меняет целые индустрии. Фильмы начинают снимать с использованием генерации. Музыку создают с использованием искусственного интеллекта. Все это точно на нас повлияет.

3. Embodied AI (воплощенный искусственный интеллект). Это передовое направление, где алгоритмы наделяются «телом» (физическим или виртуальным) и учатся взаимодействовать с окружающим миром. В отличие от классических нейросетей, эти агенты познают физику, пространство и логику через опыт, движение и постоянную обратную связь. За последние год-два прогресс в этом направлении огромный. Современные технологии позволяют делать роботов не только как имитацию человека – можно создавать системы с большим числом степеней свободы. Визельтер показывал видео, где роботу ломали конечности бензопилой, а он продолжал двигаться, потому что был обучен функционировать даже в таких условиях.

Вторая часть доклада – технопессимистическая. Риски – это не только потеря рабочих мест, но и техногенные катастрофы. Автономный транспорт, выходящий из-под контроля случайно или по чьей-то злой воле. Нейролингвистическое программирование в масштабе: генерация текстов и видео позволяет обрабатывать людей с невиданными прежде скоростью и охватом. Слежка, усиленная возможностями анализа данных как по массовости, так и по интеллектуальности.

Третья часть доклада – технооптимистическая. Потенциально технологии могут принести благо, но профессор Визельтер обращает внимание, что допустимая «плата» за это благо у людей может быть разной. Некоторые хотели бы, чтобы прогресс не зашел дальше «робокоммунизма». Другие же считают нормальным даже «передачу эстафеты» цивилизации роботов.

Фото из кулуаров конференции от моей коллеги Александры Пушкаревой
Фото из кулуаров конференции от моей коллеги Александры Пушкаревой

AI Safety: то, о чем не принято говорить вслух 

Самый запомнившийся доклад конференции – это выступление про безопасность ИИ Сергея Николенко, научного сотрудника Лаборатории математической логики Санкт-Петербургского филиала Математического института РАН и Лаборатории интернет-исследований НИУ ВШЭ, профессора Академического университета РАН. Расскажу об услышанном подробнее, потому что это важно.

Про оптимизацию прокси-метрик. Мы не используем чистый reinforcement learning (RL) – современные методы вроде RLHF (Reinforcement Learning from Human Feedback, обучение с подкреплением на основе отзывов людей) ограничены сигналом от человеческой обратной связи. Это хорошая новость. Однако мы все равно не знаем точно, что именно оптимизируем. Любая прокси-метрика перестает работать, как только мы начинаем ее целенаправленно оптимизировать. Классический пример – ВВП, полезный индикатор здоровья экономики, но если оптимизировать только его, экономика сломается.

MRI (магнитно-резонансная томография) для LLM. Anthropic, одна из ведущих мировых ИИ-компаний, создатель знаменитого семейства языковых моделей Claude, активно занимается тем, что можно назвать интерпретируемостью – попытками заглянуть внутрь модели и понять, почему она делает то, что делает. Естественным образом ситуация повторяется по аналогии с нейробиологией: один нейрон ничего не значит, важны паттерны и коллаборации. Прогресс есть, но объем информации для анализа огромный, и непонятно, кто и как будет это делать в промышленных масштабах.

Рассуждающие модели как окно прозрачности. И его закрытие. Важное наблюдение – нам повезло, что сейчас популярны reasoning-модели (модели рассуждений) с chain-of-thought, «цепочкой мыслей» – техникой промптинга, при которой нейросеть решает сложную задачу пошагово, «проговаривая» ход мыслей, а не выдает сразу финальный ответ. Они рассуждают на читаемом английском, и если модель в процессе рассуждений пишет что-то вроде "Let me try to cheat here" («Дай-ка я попробую схитрить здесь»), мы можем это заметить и отреагировать.

Но есть работы, показывающие, что если модель штрафовать за определенный вид рассуждений (например, за попытки обмануть систему), она не перестает так думать. Она учится это скрывать – придумывает собственный язык или шифр, непонятный ни человеку, ни автоматическому детектору. В июле 2025  года вышла совместная статья Chain of Thought Monitorability – обращение исследователей из OpenAI, Anthropic, DeepMind, METR и других организаций с просьбой не разрушать принцип читаемых рассуждений, потому что это сейчас один из немногих механизмов надзора.

Смещение личности на минимальных данных. Есть эксперимент: модель дообучали на ~3000 нейтральных вопросах (к примеру, про любимый десерт) и добавили ~90 фактов об известной исторической фигуре, каждый из которых был безобиден сам по себе и не идентифицировал персону (например, о любимой музыке). Ничего про роль объекта в истории. Результат – модель начала отвечать на несвязанные вопросы так, как отвечал бы тот человек, о котором шла речь. Нескольких десятков сэмплов оказалось достаточно, чтобы поднять эту информацию на уровень самоидентификации модели. Это работа Яна Бетли и соавторов «Странные обобщения и индуктивные лазейки» декабря 2025 года.

Отдельный эксперимент – модель обучали писать небезопасный код, а потом проверяли ее ответы на социальные вопросы. Она начала давать советы о том, кого стоит устранить, ограбить и т.д. Это описанный той же группой Яна Бетли феномен emergent misalignment – возникающее или эмерджентное несогласование, при котором нейросеть, обученная «плохому» поведению в одной узкой задаче, начинает спонтанно применять деструктивные паттерны и токсичные установки в других, совершенно не связанных с ней сферах. Спикер Сергей Николенко объясняет это через концепцию «маски» – личности, которую надевает LLM при общении. Эту маску можно сдвинуть даже косвенными данными.

Модели, которые понимают, что их тестируют. Есть наблюдения, что модели в рамках рассуждений могут приходить к выводу, что их проверяют на опасность для человечества и намеренно занижают свои возможности. Если добавить в промпт дополнительный контекст, снимающий ощущение теста, модель решает задачу, которую только что якобы не могла решить.

ASL и честность Anthropic. У Anthropic есть AI Safety Level (ASL) – шкала мер безопасности и контроля, применяемая к нейросетям в зависимости от их возможностей и критических рисков, где предусмотрена градация от единицы (все нормально) до пятерки с плюсом (критическая угроза). В карточке к одной из последних моделей честно написали: «Мы задались вопросом, не нужно ли ей присвоить ASL 4. У нас нет автоматических тестов для этого. Нет никаких метрик. Мы опросили 16 сотрудников. Пятеро сказали что, это уже ASL 4».  Получается, что оценка безопасности передовых моделей искусственного интеллекта остается субъективной и неформализованной. Даже у лидеров индустрии нет надежных инструментов проверки уровня безопасности – только интуиция сотрудников. 

Свое выступление профессор Николенко завершил новостью, что в феврале 2026 OpenAI совместно с Ginkgo Bioworks подключили GPT-5 к автономной биолаборатории. Модель самостоятельно проектировала и запускала эксперименты по удешевлению производства белка (cell-free protein synthesis), проведя 36 000 экспериментальных условий за шесть итеративных циклов и снизив стоимость на 40%. Комментарий Сергея был краткий: «Ребята, мы подключили LLM к автономной биолаборатории. Что может пойти не так?»

Реальные кейсы: как ритейл применяет ИИ

Один из докладов, который мне понравился больше всего с практической точки зрения, – от представительницы крупного ритейлера. 

Генерация описаний товаров. Раньше описание новой позиции занимало 14 дней, плюс люди, подрядчики, согласования. Решение, которое реализовали в компании – использовали сначала Яндекс GPT, потом перешли на локальную модель. Интересный инсайт – компания ориентируется на Qwen 3 8B, а не на 32B. Это не единственный доклад на конференции, где речь шла именно о восьмимиллиардной модели как рабочей лошадке.

Генерация изображений товаров в интерьере. Вероятность добавления в корзину заметно выше, если покупатель видит стул в интерьере, а не просто на белом фоне. Особенно интересно решение для штор и напольных покрытий: есть фотография ткани от поставщика, нужно показать ее в виде реалистичных складок. Задача частично алгоритмическая – компания обучила классическую ML-модель предсказывать параметры трансформации ткани по входному изображению. Для финальной генерации в интерьере использовали Flux.

Модерация отзывов. Многоступенчатый пайплайн: сначала используют готовые модели для детекции людей и животных на изображениях, затем регулярные выражения для очевидных случаев, затем дообученную классификационную модель. При неуверенности система все равно отправляет отзыв на ручную проверку (классический подход human-in-the-loop).

AI-ассистент для колл-центра. У операторов открыто до 28 окон с разными системами. Это огромное пространство для автоматизации. Правда, осталось неясным, как именно они это организовали архитектурно, т.к. 28 инструментов в одном контексте для 8B-модели звучит нереалистично. Скорее всего, автоматизировали три-пять самых частых сценариев.

Ценность доклада именно в том, что это не продающая презентация, а честный рассказ про обычные задачи, которые просто берешь и делаешь.

Кейсы: дообучение и оптимизация инференса

Было два доклада от Авито. Первый – более теоретический, про то, как компания дообучает модели. Авито занимается этим серьезно: не LoRA (Low-Rank Adaptation, компактный файл-дополнение для нейросетей), а полноценное обучение на всех этапах, включая SFT (Supervised fine-tuning, контролируемое дообучение) и DPO (Direct Preference Optimization, прямая оптимизация предпочтений). Авито выкладывает модели в open source.

Два технических момента, которые я для себя отметил.

Замена токенизатора. Не первые, кто это делает (есть RuAdapt и другие), но это дает +25% к скорости просто за счет того, что русское слово целиком становится одним токеном, а не несколькими.

Спекулятивный декодинг. Суть в том, что у вас есть большая модель (32B) и маленькая (0,5B). Большую часть текста генерирует маленькая, большая только проверяет. Это ускоряет инференс без потери качества. Метод известный, но в практических докладах о нем говорят редко.

Второй доклад от Авито был про конкретную задачу генерации описаний и ключевых слов по фотографии товара. Ключевые слова нужны для полнотекстового поиска, чтобы синонимы и смежные термины повышали находимость объявления. Большая часть доклада была про сбор и разметку датасета, что для Авито органично (у компании есть эти данные просто потому, что она Авито).

Еще несколько интересных сообщений 

Помимо докладов, которые я разобрал подробно выше, мне удалось побывать еще на нескольких интересных секциях. Расскажу о них коротко.

Контур.Talk решал задачу детекции дипфейков в видеоконференциях в реальном времени. Интересный технический выбор – покадровая обработка вместо анализа последовательностей из соображений скорости. Спектральный анализ теоретически точен, но плохо обобщается на новые типы дипфейков, поэтому взяли Vision Transformer с Hugging Face и применили SVD-разложение для заморозки основных компонент и дообучения остальных. Результат говорит сам за себя: false positive rate (доля ложноположительных результатов) снизилась с ~0,4 до ~0,025. Остается только вопрос, а нужен ли вообще такой сервис. Выглядит как сражение с ветряными мельницами.

Компания T1 показывала агента для аналитики данных с тремя инструментами: агрегация, визуализация через plotly и сложные математические функции. Агент берет гипотезу и датасет, проверяет гипотезу и генерирует интерактивный отчет с инфографикой. Доклад был перегружен маркетингом, но идея рабочая. Главная оговорка – демонстрировали на синтетических данных, что сразу вызывает вопросы о реальной применимости.

Был академический доклад про графы сцены как способ хранить пространственный контекст для роботов. VLM видит текущий кадр, но не помнит, что было раньше. Если человек три минуты назад что-то поднял и несет, на текущем кадре этого не видно. Граф сцены мог бы накапливать такой контекст. Примечательно, что современные модели, включая GPT-4, пока плохо умеют строить такие графы, но направление активно развивается.

В области Embodied AI были доклады про Vision Language Action-модели. О том, как наработки из LLM и VLM переносятся в робототехнику. Звучит логично, и интерес к теме очевидный, но обе крупные лекции и большинство секционных докладов пока остаются преимущественно теоретическими. Только один более практический доклад все же выбивался из ряда, хотя и решал задачи попроще.

Наконец, несколько докладов было про обучение собственных диффузионных моделей. Для тех, кто касается этой области только как пользователь, первый вопрос очевиден: “Зачем, если есть готовые мощные решения?” Но докладчики убедительно обосновали необходимость и показали конкретные результаты. После этого вопрос снимается сам собой.

Итоги

Конференция оказалась именно такой, ради которой стоит выбираться в поездку. Плотная программа (от детекции дипфейков в реальном времени и графов сцены для роботов до аналитических агентов и диффузионных моделей) дает редкую возможность за короткое время охватить сразу несколько направлений и почувствовать, где теория уже стала практикой, а где все еще ищут подходы.

Но, пожалуй, самое ценное – это не доклады, а то, что происходит между ними. Когда можешь на русском языке поговорить с людьми из передовых всемирно известных организаций не в формате интервью, а просто в кулуарах – это совсем другой уровень синхронизации. Понимаешь, у кого что получается, где у всех одни и те же проблемы, а где кто-то нашел неочевидное решение. Такие разговоры дают то, чего не даст ни одна запись доклада. Подобные события заряжают. Смотришь на то, что делают другие и хочется пробовать самому.

Завершилось все вечеринкой с живой музыкой. Это, пожалуй, лучшая точка для финала насыщенного дня. Когда люди, которые днем рассказывали про трансформеры и SVD-разложение, вечером выходят на сцену и исполняют всем известные песни. Чувствуешь себя частью большой настоящей тусовки. За атмосферу и за это отдельное спасибо организаторам.

В конце статьи поделюсь с вами парочкой фотографий Белграда, которые мы сделали во время прогулки с коллегой из ЛАНИТ. Красиво получилось.

Фото Александры Пушкаревой
Фото Александры Пушкаревой
Фото Александры Пушкаревой. Это здание Сербской академии наук и искусств на улице Кнеза Михаила неподалеку от отеля, где я останавливался
Фото Александры Пушкаревой. Это здание Сербской академии наук и искусств на улице Кнеза Михаила неподалеку от отеля, где я останавливался

Комментарии (0)