Где мы все? Судя по классическому циклу зрелости, Large Language Models (LLM) уверенно маршируют к вершине «Пика завышенных ожиданий». Энтузиазм бьёт ключом: каждый день — новые анонсы и инвестиции. Как руководитель отдела инновационных проектов в «Первой грузовой компании», я вижу этот ажиотаж и сам погружен в изучение потенциала LLM для нашей отрасли. Иллюзия всесильности ИИ сейчас сильна как никогда. Мы сейчас явно находимся на пике завышенных ожиданий.

Мой опыт: от восторга к сложным системам
В «Первой грузовой компании» мы уже вышли за рамки простых экспериментов с чат-интерфейсами. Мы интегрируем LLM в реальные бизнес-процессы. И мой опыт однозначно показал: одиночные LLM, при всей их впечатляющей способности генерировать текст или отвечать на общие вопросы, недостаточны для ответственных задач логистики. Там, где нужна абсолютная точность данных, глубокое понимание контекста специфичных операций и надежность, они спотыкаются. Галлюцинации и поверхностность — реальные риски.
Наш путь: агенты, RAG и One-Shot — не мода, а необходимость
Именно поэтому наша практика сместилась в сторону архитектур, где взаимодействуют множественные AI-агенты, дополненные ключевыми технологиями повышения надёжности и релевантности:
Мультиагентные системы: как и Герман Греф отметил про Сбер («работаем более чем с 1000 AI‑агентов»), мы видим силу в специализации и кооперации. Один агент делает работу, второй проверяет и уточняет информацию — взаимный контроль критически важен, и только такой подход позволил сильно сократить ошибки.
RAG (Retrieval‑Augmented Generation): это наш главный щит против «выдумок». Прежде чем ответить, LLM извлекает актуальные факты из наших внутренних баз знаний, документов (контракты, спецификации, регламенты) или оперативных данных. Ответ строится на основе достоверной информации, а не только на общих знаниях модели. Например, агент, отвечающий на запрос клиента о статусе вагона, сначала извлекает реальные данные из витрины данных, а затем формирует ответ.
One‑Shot / Few‑Shot обучение: мы активно используем этот подход для быстрой адаптации LLM к нашим специфичным задачам без долгого и дорогого дообучения всей модели. Показывая модели один или несколько примеров (One‑Shot/Few‑Shot) нужного формата ответа или выполнения действия в контексте конкретной функции, мы «настраиваем» её поведение прямо в процессе работы. Это делает агентов гибче.
Функции как инструменты: LLM‑агенты у нас выступают скорее как «диспетчеры». Они анализируют запрос, понимают, какую функцию или внешний API нужно вызвать (рассчитать тариф, найти информацию по вагону в БД, сгенерировать уведомление и др.), и передают на выполнение. Сами сложные вычисления или операции с данными выполняются проверенными системами.
Что видно на рынке?
Наблюдая за открытыми кейсами и заявлениями, я вижу, что наш путь не уникален. Крупные игроки и стартапы фокусируются на тех же проблемах и схожих решениях: оркестровка агентов, интеграция RAG для достоверности, использование контекстного обучения для адаптации. Это подтверждает, что мы движемся в верном направлении, отвечая на общие вызовы.
Кейсы из открытых источников
СДЭК (логистика, экспресс‑доставка). Компания автоматизировала разработку курьерских маршрутов и классификацию грузов для ВЭД за счёт ИИ. Использована генеративная нейросеть для решения задачи коммивояжёра (расчёт маршрутов с учётом пробок, веса, срочности заказов и пр.) и для автоматической классификации ТН ВЭД по текстовому описанию груза.
Этапы: с конца 2022 г. сформирована команда CDEK Digital, подготовлены данные и закуплено ПО (2023), вторая половина 2023 — обучение моделей и корректировка БП, вывод в тест (пилот).
Результаты: разработка оптимальных курьерских маршрутов ускорилась на 15%; точность машинного присвоения ТН ВЭД достигает 95%, скорость обработки заявки выросла в разы.
Организация: проект инициирован топ‑менеджментом и реализуется специализированным подразделением «CDEK Digital» (более 550 ИТ‑специалистов), которые совместно с внешними партнерами развивают и масштабируют решения. Ключевая сложность: подготовка качественных данных под ИИ.РЖД / ВНИИЖТ (транспорт, пассажирская логистика). Российские железные дороги тестируют LLM‑помощников для пассажиров и сотрудников. Для путешественников разрабатываются чат‑боты на основе больших языковых моделей, способные отвечать на вопросы о расписании поездов, бронировании билетов, альтернативных маршрутах при задержке и пр. Для работников железнодорожного транспорта создается «интеллектуальный ассистент» (на базе LLM) для обучения и консультаций: он обучен на десятках проф документов и помогает инженерам‑электрикам и диспетчерам решать рутинные технические вопросы.
Этапы: пилотные разработки ведутся ЦИИ ВНИИЖТ и РЖД (софтовые прототипы чат‑ботов), планируется поэтапная интеграция в сервисы.
Эффекты пока качественные: ожидается рост скорости обслуживания пассажиров, упрощение поиска информации; среди сотрудников — повышение уровня подготовки (LLM генерирует отчёты, варианты сценариев, проводит тестирование знания регламентов).НЛМК (металлургия). Группа НЛМК в апреле 2024 г. провела пилот «генеративного ИИ» для ускорения разработки программных продуктов.
Задача: автоматизировать рутинные задачи IT‑специалистов (генерация кода, шаблонов, документации) при разработке ПО.
Технологии: тестированы разнообразные инструменты GenAI (вероятно, ChatGPT‑подобные), адаптированные под задачи разработки.
Этапы: 25 разработчиков NLMK‑IT совместно с партнёром Axenix за апрель 2024 г. протестировали решение на реальных рабочих задачах по управлению производством, HR‑сервисам, портальным решениям.
По итогам пилота производительность программистов в рутинных задачах выросла на 53%, а скорость обработки запросов на доработку ПО — на 34%. После этого решение масштабируется: планируется распространить AI‑помощников на все команды разработки.СИБУР (нефтехимия). В мае 2024 г. СИБУР (одна из крупнейших нефтехимических компаний) подписал соглашение со Сбером и ЦРТ об интеграции LLM Сбербанка (GigaChat) в ключевые бизнес‑процессы. Созданы несколько AI‑ассистентов: для инженера‑диагноста (анализ аномалий оборудования и гипотезы причин поломок), для закупок (подбор аналогов материалов с учётом цены и качества), для R&D (моделирование полимерных рецептур и свойств) и для финансиста (аналитика факторов маржинальности).
Этапы: соглашение подписано в мае 2024, затем разрабатывались и тестировались прототипы ассистентов в отдельных подразделениях.
Метрики пока формируются: по заявлениям компании, решения позволяют ускорить принятие решений и повысить точность прогнозов без конкретных чисел.Ростех («ТехАссистент»). В корпорации «Ростех» разрабатывают чат‑бота для технической поддержки инженеров («ТехАссистент»), обученного на обширных базах данных документации Siemens, Schneider Electric и отечественных ПЛК.
Задача: ускорить устранение неисправностей по электронным журналам. По словам разработчиков, бот способен автоматически отвечать на треть обращений (примерно 30% обращений техподдержки).
Этапы: решение создаётся силами ЦИИ «Ростеха», уже запущены пилоты по наиболее распространённым проблемам.
Эффект: сокращена нагрузка на специалистов, высвобождая инженеров для сложных задач. Организационно проект ведётся силами Ростеха без привлечения иностранных LLM — система разрабатывается на отечественных нейросетях.Газпром нефть (нефтегазовая промышленность). У компании «Газпром нефть» внедрён интеллектуальный помощник для анализа данных ПЛК и логов оборудования. Система отслеживает аварийные коды (например, перегрев насоса), автоматически формулирует гипотезы причин («засор фильтра») и предлагает инструкции по устранению («очистить фильтр по регламенту MT-47»).
Этапы: пилот интеграции ИИ в систему управления оборудованием уже проведён, решение отрабатывается на реальных станциях.
Метрики: позволяет стандартизировать и ускорить диагностику, снизить простои (пока без численных данных).
Инициатива велась R&D‑подразделением компании, возможно с участием «Газпром нефть — Центр»; использование технологии — собственная разработка.Сбер (финансовые услуги и ИКТ). Решение: Семейство виртуальных помощников «Салют» на базе LLM‑моделей (ruGPT-3, GigaChat) для клиентского сервиса и управления финансами. Система обрабатывает запросы, анализирует расходы, предлагает инвестиционные идеи и персонализирует диалоги з а счет технологий NLU.
Этапы: Полное внедрение в мобильное приложение и онлайн‑банкинг.
Метрики: Обработка 80% типовых запросов без операторов.
Разработчик: Внутренняя R&D‑команда Сбера.Ростелеком (телекоммуникации). Решение: Речевая аналитика на базе ИИ (программа Smart Logger) для контактных центров. Система расшифровывает диалоги, выявляет проблемы клиентов, автоматизирует отчётность.
Этапы: Внедрено в 75% процессов обслуживания.
Метрики: Сокращение времени диалогов на 1 млн минут в год; Покрытие 3000+ рабочих мест операторов.
Партнёр: Компания ЦРТ (используется GigaChat).
Мой прогноз: через пик к реальной пользе
Опираясь на цикл зрелости и наш практический опыт, я ожидаю:
Неминуемая коррекция (1-2 года): эйфория сменится реализмом. Станет очевидно, что LLM — не волшебные палочки, а их эффективная интеграция в сложные процессы требует глубокой доработки (агенты, RAG), значительных ресурсов и управления рисками. Ограничения моделей выйдут на первый план.
Расцвет гибридных подходов: комбинации мультиагентных систем, RAG и контекстного обучения (One‑Shot/Few‑Shot) станут де‑факто стандартом для создания ценных бизнес‑решений. Именно они позволят преодолеть «пропасть разочарования», доказывая надёжность и релевантность.
«Склон просвещения»: придет чёткое понимание ниш. Где сияют RAG‑агенты (работа с клиентскими запросами на основе актуальных данных, анализ документов), где незаменимы классические системы, а где нужны их гибриды. Ценность сместится к гипер‑кастомизации решений под конкретный процесс.
«Плато продуктивности»: технологии типа RAG, агентские фреймворки и специализированные LLM навсегда встроятся в бизнес‑процессы. Их применение станет предсказуемым и понятным, а значит уйдёт волна энтузиастов, которые пытаются встроить во все процессы LLM. Шумиха уляжется, останется работающий инструментарий для своих узкоспециализированных задач.
Моё заключение
Мы постепенно переходим от энтузиазма к требовательному этапу. Когда нужен реальный эффект для бизнеса, а не только игрушка на похвастаться перед коллегами. Предстоящая коррекция ожиданий — не провал, а необходимый этап созревания. Наша задача сейчас — учиться на опыте коллег (как в примерах выше) и целенаправленно строить мосты к «плато продуктивности» через разумное использование технологий вроде RAG и агентских архитектур.