Команда AI for Devs перевела статью, в которой автор делится прогнозами о будущем ИИ-агентов в 2025 году. Его выводы: несмотря на шумиху, «автономные агенты» столкнутся с экономическими и техническими барьерами. Почему текущий подход к архитектуре агентов не сработает и какие методы действительно приносят результат — читайте в статье.
Я разработал более 12 систем AI-агентов в таких областях, как разработка, DevOps и обработка данных. Вот почему текущий ажиотаж вокруг автономных агентов математически невозможен, и что действительно работает в продакшене.
Все говорят, что 2025 год — это год AI-агентов. Заголовки повсюду: «Автономный ИИ преобразит рабочие процессы», «Агенты — следующая граница», «Будущее за агентами». Тем временем, я провел последний год, создавая различные системы агентов, которые действительно работают в продакшене. И именно поэтому я ставлю против текущего ажиотажа.
Я не какой-то скептик, пишущий с боку. За последний год я разработал более десятка систем агентов, работающих в проде, по всему жизненному циклу разработки ПО:
Агенты для разработки: генераторы UI, которые создают функциональные React-компоненты из естественного языка, агенты для рефакторинга кода, которые модернизируют устаревшие кодовые базы, генераторы документации, которые автоматически поддерживают API-документацию, и генераторы функций, которые превращают спецификации в рабочие реализации.
Агенты для данных и инфраструктуры: агенты для работы с базами данных, которые обрабатывают сложные запросы и миграции, системы автоматизации DevOps, управляющие инфраструктурой как кодом на нескольких облачных провайдерах.
Агенты для качества и процессов: AI-управляемые CI/CD пайплайны, которые исправляют ошибки линтинга, генерируют полные тестовые наборы, выполняют автоматические ревью кода и создают детализированные pull-запросы с правильными описаниями.
Эти системы работают. Они приносят реальную ценность. Они экономят часы ручной работы каждый день. И именно поэтому я считаю, что многое из того, что говорят о 2025 годе как о «годе агентов», не учитывает ключевые реалии.
TL;DR: Три жесткие истины об AI-агентах
После создания AI-систем вот что я усвоил:
Ошибки накапливаются экспоненциально в многоступенчатых рабочих процессах. 95% надежности на каждом шаге = 36% успешности за 20 шагов. В продакшн-системах нужно 99,9%+.
Окна контекста создают квадратичные затраты на токены. Долгие разговоры становятся слишком дорогими при масштабировании.
Реальная проблема — не в возможностях ИИ, а в проектировании инструментов и систем обратной связи, которые агенты могут эффективно использовать.
Математическая реальность, о которой никто не говорит
Вот неудобная правда, вокруг которой все компании по разработке AI-агентов танцуют: накопление ошибок делает автономные многоступенчатые рабочие процессы математически невозможными на производственном уровне.

Посчитаем. Если каждый шаг в рабочем процессе агента имеет 95% надежности, что является оптимистичной оценкой для текущих LLM, то:
5 шагов = 77% успешности
10 шагов = 59% успешности
20 шагов = 36% успешности
Для продакшн-систем требуется надежность 99,9%+. Даже если вам удастся достичь 99% надежности на каждом шаге (чего пока никто не добился), вы получите лишь 82% успешности за 20 шагов. Это не проблема промптов. Это не проблема возможностей модели. Это математическая реальность.
Мой DevOps-агент работает именно потому, что это не автономный 20-шаговый рабочий процесс. Это 3-5 дискретных, независимо проверяемых операций с явными точками отката и человеческими контрольными точками. «Агент» управляет сложностью генерации инфраструктурного кода, но система спроектирована с учетом математических ограничений надежности.
Каждая успешная система агентов, которую я построил, следовала той же модели: ограниченные контексты, проверяемые операции и (иногда) человеческие точки принятия решений на критических этапах. Как только вы пытаетесь объединить больше нескольких операций в автономный процесс, математика убивает вас.
Экономика токенов, которая не сходится
Есть еще одна математическая реальность, которую проповедники агентов удобно игнорируют: окна контекста создают квадратичное увеличение стоимости, что делает разговорных агентов экономически невозможными.
Вот что на самом деле происходит, когда вы создаете «разговорного» агента:
Каждое новое взаимодействие требует обработки ВСЕГО предыдущего контекста.
Стоимость токенов растет квадратично с увеличением длины разговора.
100-шаговый разговор стоит от $50 до $100 только за токены.
Умножьте на тысячи пользователей, и вы получите экономику, которая не выдерживает конкуренции.
Я узнал это на собственном опыте, когда создавал прототип разговорного агента для работы с базой данных. Первые несколько взаимодействий были дешевыми. Но к 50-му запросу в сессии каждый ответ стоил несколько долларов — больше, чем сам результат. Экономика просто не работает для большинства сценариев.

Мой агент по генерации функций успешен, потому что он полностью без состояния: описание → функция → готово. Нет необходимости поддерживать контекст, отслеживать разговор, нет взрывного увеличения стоимости токенов. Это не «разговор с вашим кодом», это целенаправленный инструмент, который эффективно решает конкретную задачу.
Самые успешные «агенты» в продакшн-среде вовсе не являются разговорными. Это умные, ограниченные инструменты, которые делают одну вещь хорошо и не мешают работать.
Сталкиваемся с реальностью устройства инструментов
Даже если вы решите математические задачи, вы столкнетесь с другой проблемой: создание инструментов уровня продакшена для агентов — это совершенно другая инженерная дисциплина, которую многие команды недооценят.
Вызовы инструментов сейчас довольно точны. Реальная проблема — проектирование инструментов. Каждый инструмент должен быть тщательно разработан, чтобы предоставить правильную обратную связь, не перегружая окно контекста. Нужно подумать о следующем:
Как агент узнает, что операция частично удалась? Как сообщить о сложных изменениях состояния, не тратя токены?
Запрос к базе данных может вернуть 10 000 строк, но агенту нужно только знать: «запрос выполнен, 10 тыс. результатов, вот первые 5». Проектирование этих абстракций — это искусство.
Когда инструмент не работает, какую информацию агенту нужно для восстановления? Слишком мало — он застрянет; слишком много — вы потратите контекст.
Как справиться с операциями, которые влияют друг на друга? Транзакции базы данных, блокировки файлов, зависимости ресурсов.
Мой агент для работы с базой данных работает не потому, что вызовы инструментов ненадежны, а потому, что я потратил недели на проектирование инструментов, которые эффективно взаимодействуют с ИИ. Каждый инструмент возвращает структурированную обратную связь, которую агент может действительно использовать для принятия решений, а не просто необработанные ответы от API.
Компании, обещающие «просто подключите свои API, и наш агент все решит», не проделали эту инженерную работу. Они воспринимают инструменты как интерфейсы для человека, а не для ИИ. Результат — агенты, которые технически выполняют успешные вызовы API, но не могут выполнить сложные рабочие процессы, потому что не понимают, что произошло.
Грязный секрет каждой продакшн-системы агентов заключается в том, что ИИ выполняет, возможно, только 30% работы. Остальные 70% — это инженерия инструментов: проектирование интерфейсов обратной связи, эффективное управление контекстом, обработка частичных сбоев и создание механизмов восстановления, которые ИИ действительно может понять и использовать.
Проверка реальности интеграции
Но давайте предположим, что вы решили проблемы с надежностью и экономикой. Вам все равно нужно интегрироваться с реальным миром, а реальный мир — это беспорядок.
Корпоративные системы — это не чистые API, ожидающие, что ИИ-агенты будут их оркестровать. Это устаревшие системы с особенностями, частичными режимами сбоев, изменяющимися потоками аутентификации без предупреждения, лимитами скорости, которые зависят от времени суток, и требованиями соответствия, которые не укладываются в шаблоны подсказок.
Мой агент для работы с базой данных не просто «автономно выполняет запросы». Он управляет пулом соединений, обрабатывает откаты транзакций, учитывает реплики только для чтения, управляет тайм-аутами запросов и ведет логирование для аудитных следов. ИИ генерирует запросы, все остальное — это традиционное программирование систем.
Компании, обещающие «автономных агентов, которые интегрируются с всем вашим технологическим стеком», либо чрезмерно оптимистичны, либо еще не пытались создавать продакшн-системы в масштабе. Интеграция — это то место, где ИИ-агенты обречены.
Что действительно работает (и почему)
После создания более десятка различных систем агентов на протяжении всего жизненного цикла разработки ПО, я понял, что успешные системы следуют одному паттерну:
Мой агент для генерации UI работает, потому что каждый сгенерированный интерфейс проверяется человеком перед развертыванием. ИИ обрабатывает сложность перевода естественного языка в функциональные компоненты React, но окончательные решения о пользовательском опыте принимает человек.
Мой агент для работы с базой данных работает, потому что он подтверждает каждую разрушительную операцию перед выполнением. ИИ решает сложные задачи перевода бизнес-требований в SQL, но человек контролирует целостность данных.
Мой агент для генерации функций работает, потому что он работает в пределах четко определенных границ. Дайте ему спецификацию — получите функцию. Без побочных эффектов, без управления состоянием, без сложности интеграции.
Моя система автоматизации DevOps работает, потому что она генерирует инфраструктуру как код, который можно просматривать, версионировать и откатывать. ИИ обрабатывает сложность перевода требований в Terraform, но пайплайн развертывания поддерживает все механизмы безопасности, на которые мы привыкли полагаться.
Мой агент для CI/CD работает, потому что на каждом этапе есть четкие критерии успеха и механизмы отката. ИИ обрабатывает сложность анализа качества кода и генерации исправлений, но пайплайн контролирует, что действительно будет слито.
Паттерн ясен: ИИ справляется с сложностью, человек сохраняет контроль, а традиционная разработка ПО обеспечивает надежность.
Мои прогнозы
Вот мой конкретный прогноз о том, кто будет испытывать трудности в 2025 году:
Стартапы с венчурным финансированием, которые предлагают «полностью автономных агентов», столкнутся с экономическим барьером первыми. Их демонстрации отлично работают с 5-шаговыми рабочими процессами, но клиенты будут требовать процессы из 20+ шагов, которые ломаются с математической точки зрения. Затраты будут расти, когда они попытаются решить нерешаемые проблемы с надежностью.
Компании по разработке корпоративного ПО, которые добавили «AI-агентов» в существующие продукты, столкнутся с застоем в принятии. Их агенты не могут интегрироваться достаточно глубоко, чтобы обрабатывать реальные рабочие процессы.
Тем временем победителями станут команды, строящие ограниченные, специализированные инструменты, которые используют ИИ для сложных задач, сохраняя при этом контроль человека или строгие границы для критически важных решений. Меньше «автономности во всем» и больше «крайне способных помощников с четкими границами».
Рынок научится различать ИИ, который хорошо работает на демо, и ИИ, который стабильно выполняет задачи в реальности. Это обучение обойдется дорого для многих компаний.
Я не ставлю против ИИ. Я ставлю против текущего подхода к архитектуре агентов. Но я уверен, что будущее будет гораздо ценнее, чем предполагает текущий ажиотаж.
Как строить правильно
Если вы планируете создавать системы с ИИ-агентами, начните с этих принципов:
Определите четкие границы. Что именно ваш агент может делать, а что он передает человеку или детерминированным системам?
Проектируйте с учетом сбоев. Как вы будете обрабатывать 20-40% случаев, когда ИИ ошибается? Какие у вас механизмы отката?
Решите проблему экономики. Сколько стоит каждое взаимодействие и как это масштабируется с увеличением использования? Отсутствие состояния часто лучше его наличия.
Приоритет надежности над автономией. Пользователи доверяют инструментам, которые работают стабильно, больше, чем системам, которые иногда делают чудеса.
Стройте на прочных основах. Используйте ИИ для сложных частей (понимание намерений, генерация контента), но полагайтесь на традиционную разработку ПО для критически важных частей (выполнение, обработка ошибок, управление состоянием).
Революция агентов приближается. Только она будет выглядеть совсем не так, как обещают в 2025 году. И именно это обеспечит ей успех.
Русскоязычное сообщество про AI в разработке

Друзья! Эту статью подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
Комментарии (0)
Wicron
24.09.2025 14:35Текст содержит серьёзные неточности. В частности квадратичная зависимость вычислительной сложности от длины контекста в случае сетей с мамба слоями уже близка к линейной. К тому же есть ИИ-агенты не классифицирующего акцента на кейсы с большей вариативной генеративностью, нежели с классифицируемостью
Zippy
24.09.2025 14:35Ну можно верить не в самих агентов а в круглые сумы которые на этом зарабатываются
WASD1
24.09.2025 14:35Ну так нужны новые языки "под ключ" для агентов.
С новыми workflow и хранением проекта.
Workflow - снижает ошибки (ну т.е. обратные петли с тестированием и watchdog'ом зовущим челвоека разгребать если пайп не прошёл).
Проект - древовидная документация в конфлюесн + интерфейсы (боле-менее соответствующая структуре проекта в ФС).
Любой промпт (заливает в проект атомарно), вызывает следующие изменения:
1. Меняет "верхнеуровневую доку" конфлюенс (требует апрува от человека "продолжай")
2. По результатам изменений конфлюенса - меняет код, доуточняет изменение интерфейсов (которые через doxigen-like тоже экспортятся в доку) и нижнеуровневой доки
3. Дальше - прогоняет пайплайны, дописывает автотесты и т.д.
Основная фишка - проект это ВЕРХНЕУРОВНЕВАЯ ДОКА (которую читает агент) + код в файликах примерно в соотношении: 1 страничка : 1 файлик (с интерфейсами если есть разделение на них и реализацию).
Kodex_Faber
Мне кажется, что интеллект - это что-то иное, а не просто нечто наполненное данными. Также как и знание тоже не просто наличие данных по данному вопросу - это что-то большее. Именно поэтому нужно придумать белее точное название чем ИИ...
constXife
Ну из того что я помню из института (может другие поправят), ИИ это общее название раздела информатики, которая включает кучу подразделов, в которых даже нейросетями не пахнет, типа Байеса или Дейкстра. И в итоге, вместо ИИ агента будем писать что-то вроде "агент для коммуникации с генеративными ИИ на основе трансформеров с механизмом внимания"? Ну наверное это достаточно точно, но как-то длинновато.
Guid0Fawkes
На Хабре была статья с очень точным названием для нынешнего ИИ — мешок слов.
А все несогласные комментарии можно было бы обобщить до несколько более точного термина: продвинутый мешок слов.
Zippy
так ИИ как междисциплинарное научное направление основаное в 1956 грду изначально и задумывался как имитация конгитивных способностей человека. Ну типа раз наблюдать напрямую работу мозга не можем то жавайте его имитировать. А неудачные названия в науке сплошь и рядом.
Естественно мозг не работает пожбирая вероятности каждого следующего слова в зависимсти от контекста и предыдущего текста.
мозг работает как аналоговый вычислитель а не дискретный (как бы ни ьыло огромно число текстовых токенов оно все равно конечно и его можно общитать).
мозг оперируетабстрактными идеями (знаменитый пример идеи ложки) непрерывными визуальными образами,. мозг понимает физический мир может планировать и имеет заложеные эволюцией императивы к действию.
Поэтому пока не существует даже теоретических наработок создания так называемого "сильного ИИ". да и зачем? искуственный мозг и работать будет как обычный человеческий.
dkeiz
Имитация Интеллекта.
SergeyVN94
Матрица вероятностей.