
Во время недавнего трансатлантического перелёта Марк Раддок, предприниматель-резидент в GALLOS Technologies, решил задействовать свою команду ИИ-агентов. На высоте 34 тысяч футов над Атлантикой у него оставалось меньше 48 часов до важнейшей демонстрации продукта для ключевого клиента, а его программная платформа всё ещё была не готова.
Дисклеймер: это вольная адаптция статьи издания VentureBeat. Перевод подготовила редакция «Технократии». Чтобы не пропустить анонс новых материалов подпишитесь на «Голос Технократии» — мы регулярно рассказываем о новостях про AI, а также делимся полезными мастридами и актуальными событиями.
Если у вас стоит задача интеграции ИИ в бизнес-процессы, то напишите нам.
К тому моменту, как самолёт пересёк Исландию, его «рой Claude Code», как он позже рассказал в интервью VentureBeat, создал более 50 React-компонентов, набор макетов API для трёх корпоративных интеграций и полноценный административный интерфейс. То, на что у команды из людей ушло бы 18 рабочих дней, уложилось в шестичасовой перелёт. Причём результатом стал не прототип, а полноценный программный каркас: задокументированный, протестированный и защищённый, с готовыми к продакшену Docker-конфигурациями и CI/CD-пайплайном.
«Я больше никогда не буду строить софтверную компанию по-старому, обещаю вам», — сказал Раддок в интервью на следующий день.
Опыт Раддока, о котором он впервые написал в LinkedIn на прошлой неделе, не единичен. Это лишь отражение значительного скачка возможностей ИИ, случившегося этим летом. За считанные месяцы способность систем выполнять сложную инженерную работу выросла с головокружительной скоростью, нелинейно. Прогресс зафиксирован сразу в нескольких направлениях, и в совокупности он означает фундаментальное изменение в том, как создаётся софт. Изменение настолько радикальное, что прошлогодние подходы уже выглядят устаревшими.
Эпоха «вайбкодинга» — разговорной, во многом исследовательской практики, когда ИИ пишешь код по подсказкам «на лету» (термин ввел ИИ-исследователь Андрей Карпатый), — уходит. На смену приходит новая, более строгая парадигма: агентное роевое программирование.
(Конечно, для большинства разработчиков-энтузиастов «вайбкодинг» ещё жив. Но когда речь идёт о серьёзной корпоративной разработке, наш фокус смещается именно туда.)
Лето, когда AGI стало реальным для разработчиков
«Даже термин вайбкодинг уже стал наследием. Он устарел», — сказал мне Вал Берковичи, директор по ИИ в компании WEKA. — «Его вытеснила концепция агентного роевого программирования, где несколько агентов в координации создают очень функциональные MVP и полноценные приложения первой версии».
И это говорит человек с весомым бэкграундом: Берковичи — ветеран инфраструктуры, бывший CTO NetApp и один из основателей CNCF, которая курирует Kubernetes.
Идея «роев» не нова — SDK от OpenAI изначально назывался Swarm, когда в прошлом году вышел в экспериментальном режиме. Но именно этим летом возможности роев достигли точки перегиба.
Сам Берковичи, ранее скептик AGI, признался, что теперь верит в её неизбежное появление. Его переубедили летние успехи в области генерации кода и трансформация его собственной команды. Даже самый циничный инженер, известный под прозвищем «Принц Тьмы», изменил своё мнение, впечатлённый качеством и скоростью, с которыми современные агентные системы работают.
Для разработчиков с десятилетиями опыта это похоже на научную фантастику. «Опытные программисты видят, как всё наше ремесло за 30–40 лет меняется радикально всего за несколько месяцев», — отметил Берковичи.
Разбор скачка: как работают роевые агентные системы
Взрывной прогресс обеспечило слияние трёх факторов:
новая генерация базовых моделей,
зрелость агентных архитектур,
стремительное развитие навыков у людей, управляющих агентами.
Основываясь на разговорах с Раддоком и другими пионерами, можно выделить три ключевых столпа ускорения.
1. Более умные базовые модели
Интеллект самих моделей этим летом резко вырос. OpenAI (GPT-5), Anthropic (Claude 4) и xAI (Grok 4) сделали большой шаг вперёд. На эталонном тесте SWE-bench (способность ИИ закрывать реальные GitHub-issues) новые модели побили все рекорды. GPT-5 показал 74,9% успешных решений против 58,4% у модели o3 в июле. Claude Opus 4.1 в августе достиг 74,5% против 72,4% в мае.
2. Сложные агентные архитектуры
Ещё важнее, чем сама модель, — то, как она организована. «Рой» — это архитектура, где задача разбивается на части и распределяется между несколькими специализированными агентами. В отчёте организации METR, изучающей передовые системы ИИ, опубликованном в марте, говорится, что «длина задач, которые способен выполнять ИИ, удваивается каждые 7 месяцев». Однако Амджад Масад, CEO Replit, написал в Twitter в среду, что это «сильно недооценивает» реальные показатели: за тот же период их софтверный агент показал десятикратный рост производительности благодаря оркестрации, включая мультиагентную архитектуру (см. диаграмму выше и ниже). Для справки: именно решение Replit использовал Марк Раддок из GALLOS.

Новое поколение агентных систем освоило несколько ключевых структурных возможностей:
Перепланирование: агенты динамически корректируют список задач, если шаг неудачен или появляется лучший путь. Это позволило, например, Warp достичь рекордных 75,8% на SWE-bench.
Мультиагентная специализация: вместо того чтобы один ИИ пытался делать всё сразу, рои агентов распределяют роли. Агент-«планировщик» разбивает задачу на части, агенты-«кодеры» пишут код, а агент-«критик» проверяет результат. Такая схема повторяет работу человеческой команды разработчиков и лежит в основе фреймворков вроде Claude Flow, созданного в Торонто Реувеном Коэном. Берковичи описывает это как систему, где «десятки экземпляров Claude Code работают параллельно, выполняя задачи по спецификациям, документации… охватывая весь цикл CI/CD и DevOps». Именно этот механизм лежит в основе роевого подхода: он сжимает месяцы работы команды в один час.
Переключение моделей: системы направляют подзадачи лучшей модели — Claude для рассуждений, GPT-5 для кода, Grok 4 для быстрых итераций.
Интеграция инструментов: Это, пожалуй, главное изменение правил игры. Агенты больше не пишут код «в вакууме». Теперь они встроены в реальную среду разработчика и используют ключевые инструменты: grep для поиска по кодовой базе, pytest для запуска тестов, утилиты сборки вроде make или pip для компиляции и настройки проектов, а также git diff для управления изменениями. Такой подход замыкает цикл между генерацией кода и его проверкой в реальных условиях.
Длительная автономность: Ранние версии агентов часто «терялись» или выходили за рамки контекста при работе со сложными задачами. Как отметил в Twitter в среду основатель Y Combinator Пол Грэм, ключевым тестом для ИИ является то, насколько долго он может «продуктивно продолжать размышлять над задачей». Этим летом этот показатель вырос в разы. Так, Agent 3 от Replit теперь способен работать автономно до 200 минут, выполняя задачу от начала до конца, — резкий скачок по сравнению с февральским Agent 2, который справлялся лишь с 20 минутами непрерывной работы.
3. Рост роли «агентного инженера»
Финальное звено — человек. Самые успешные разработчики не пассивно «промптят» ИИ, а становятся архитекторами-кураторами.
Процесс Раддока, например, включает:
генерацию агентами подробного PRD (Product Requirements Document),
рецензию этого кода агентом с «персоной скептика»,
собственный финальный обзор.
«Нужно быть предельно намеренным, — пояснил он. — Я теперь знаю, как задавать вопросы, что просить, какие рамки ставить, чтобы агент сам проверял свои результаты».
От прототипа к продакшену
Самое убедительное свидетельство летнего скачка в том, что результат работы роев агентов давно перешагнул границы прототипов, которые ещё недавно считались потолком агентного программирования. Сегодня агенты создают фундамент приложений, готовых к промышленной эксплуатации. Это опровергает распространённую критику о том, что код, сгенерированный ИИ, — «сырой мусор», непригодный для реального использования.
Раддок особенно подчёркивает этот момент. Приложение, созданное им во время перелёта, было «готово к Docker, готово к Kubernetes, проходило все проверки безопасности, которые вы ожидаете… ещё до того, как я приземлился». И это не случайность, а результат методики. Он всегда начинает проект с «канонического шаблона» в GitHub, где уже встроены пайплайны для проверок безопасности и качества кода.
Здесь критически важной становится специализация агентов для нужд бизнеса. Раддок назначает своим агентам особые «персоны», чтобы обеспечить дисциплину. Например, один агент работает в роли «ветерана безопасности с 15-летним стажем» и глубокой экспертизой в анализе кода на уязвимости. Его задача — проверка работы разработчиков, что создаёт систему сдержек и противовесов, имитирующую ревью старших инженеров.
Опыт Берковичи подтверждает это. Он отмечает, что рои агентов теперь создают приложения с «аудитами безопасности, red team-тестами, документацией по комплаенсу и корпоративной аутентификацией» — всем тем, что отличает демонстрацию от продукта, готового к развёртыванию. По его словам, рой автоматизирует весь строгий жизненный цикл CI/CD и DevOps.
Это сдвиг огромного масштаба. Разговор сместился от вопроса «может ли ИИ написать функцию или наколдовать прототип» к вопросу «может ли команда агентов построить, протестировать, защитить и развернуть полноценное приложение». Ответ всё чаще — да. С одним большим «но».
Реальность: хорошие и плохие дни
Однако новая парадигма всё ещё со��ряжена с трудностями. Производительность роев агентов бывает непостоянной. «Бывают дни, когда появляются блестящие агенты, и я поражён их работой, тщательно её проверяю, — признался Раддок. — А бывают дни, когда приходит агент, ведущий себя как… полный идиот». Он отметил, что никогда не знает заранее, какой результат получит. Чтобы обойти это, он запускает параллельно несколько версий одного и того же продукта и затем выбирает ту, что показала себя лучше остальных.
Главная проблема, впрочем, заключается в огромной когнитивной нагрузке при управлении такими системами. Узким местом становится не скорость написания кода, а скорость его проверки. Это тормозит и раздражает людей. Недавнее исследование Metr.org показало, что на сложных задачах инструменты ИИ могут даже замедлять работу опытных разработчиков: выгода от быстрой генерации кода теряется из-за долгих циклов ревью и отладки.
Вопреки философии «vibe coding», предполагающей, что ИИ работает сам по себе без глубокого вмешательства, опытные инженеры, напротив, хотят большего контроля. Они становятся всё более открыты к использованию LLM, но не принимают идею системы, которая строит всё полностью без плотного диалога и обратной связи. Настоящий вызов для агентных платформ — предоставить мощную автоматизацию, не лишая разработчика возможности вмешиваться, задавать вопросы и направлять процесс.
Это подводит к ещё одной важной мысли: агентное роевое программирование — это не замена разработчиков, а усиление самых квалифицированных из них. Их роль трансформируется: от человека, который сам пишет код, к архитектору и валидатору работы команды, управляемой ИИ.
Цикл «хайпа» обгоняет реальность. Шесть месяцев назад CEO Anthropic предсказывал, что к этому моменту ИИ будет «писать 90% кода». Очевидно, мы ещё далеко от этого рубежа. Да, прогресс идёт экспоненциально, что подтверждают графики METR и Replit, но путь к полностью автономной и надёжной разработке ПО остаётся сложным и тернистым.
На недавнем мероприятии DeepMind кто-то спросил CEO компании Джеффа Дина, можно ли доверить ПО, написанное LLM, управление самолётом. После долгой паузы, как сообщают очевидцы, он ответил: «А люди в самолёте есть?» Эта полушутливая реплика подчеркнула, какие серьёзные вызовы верификации ещё предстоит решить. Дин добавил, что, хотя в реализации нужно быть крайне осторожным, скорость развития технологий такова, что в недалёком будущем он действительно ожидает: большая часть софта будет писаться LLM.
Новый «ров» для бизнеса
Стремительное развитие изменило рынок навсегда. Демократизация агентных воркфлоу и доступных инструментов вроде Claude Code Interpreter разрушает барьеры для создания сложных систем.
Это создаёт новую реальность. Как сказал Раддок, сегодня «защитный ров» для компании — это не код, который можно построить за дни или часы, а уникальное понимание проблемной области и способность воплощать решения с невероятной скоростью.
Для лидеров и технических директоров лето 2025-го войдёт в историю как момент старта новой гонки — гонки, которую выиграют те, кто лучше всего научится управлять интеллектом агентных систем.
Комментарии (0)
diderevyagin
15.09.2025 15:37Ждем откровений "Рой слил бюджет проекта за 1 час без положительного результата"
blik13
15.09.2025 15:37Сегодня агенты создают фундамент приложений, готовых к промышленной эксплуатации. Это опровергает распространённую критику о том, что код, сгенерированный ИИ, — «сырой мусор», непригодный для реального использования.
Для максимальной убедительности автор исходной статьи мог бы привести в пример хотя бы нескольких приложений, которые созданы таким образом. Но не привёл.
CloudlyNosound
15.09.2025 15:37агентное роевое программирование
Скормив Гуглу такой запрос, ничуть не удивлён единственному упоминанию такового, со ссылкой именно на эту статью.
Загуглив же термин из источника, получаем, хотя и более значительную, но тоже слабо репрезентативную выборку. Понятно, что термины из воздуха не берутся и их кто-то придумывает и повсеместно потом внедряет, но пока это не выглядит чем-то, что точно массово приживется. Нужно ещё немного подождать.
Ещё интересен вопрос цены. Если это будет кратно дороже, а результат всё ещё надо контролировать, хотя-бы тем же самым роем тестировщиков, они там явно кое-куда упрутся. В очень знакомый и предсказуемый тупик. А потом придумают рои объединять ещё во что-нибудь, и так далее.
Упоминание созданного за 6 часов "протестированного и задокументированного программного каркаса" тоже выглядит спекулятивно.
Ну и в целом - только-только "все начали вайбкодить", как оказалось, что "вайбкодинг мёртв". Должно быть немного обидно тем многим, кто в это поверил всей душой.
Tishka17
15.09.2025 15:37А потом придумают рои объединять ещё во что-нибудь, и так далее.
Нужна пасека
JuryPol
15.09.2025 15:37История про 6 часов явно с душком...
Стремительное развитие изменило рынок навсегда.
...
Для лидеров и технических директоров лето 2025-го войдёт в историю как момент старта новой гонки — гонки, которую выиграют те, кто лучше всего научится управлять интеллектом агентных систем.
Как же это похоже на приемы «главных следователей главной прокуратуры» по типу «прямо сейчас с вашего счета идут транзакции»... «зафиксирован захват вашей учетной записи на госуслугах»... «срочно переводите деньги на безопасный счет».
Такое ощущение, что автор на разогреве темы «концепции агентного роевого программирования». Видимо будут втюкивать. Агентами как-то уже никого не удивишь.
Глянул на «Работаю PR-директором в «Технократии». Пишу про пиар, маркетинг и рекламу в своем канале» - расстроился. Потерял десять минут зря.
madballer34 Автор
15.09.2025 15:37В статье стоит тег «перевод», внутри есть целый дисклеймер, что это перевод колонки основателя Venture Beat, но, видимо, этого недостаточно...
Zippy
15.09.2025 15:37Уже мертв? Шото быстро.. Блокчейн, nosql и квантовые вычисления и то дольше продержались
ItanB
15.09.2025 15:37Я одного не понимаю, натыкаясь на подобные статьи. А как эти системы понимают, что именно нужно роем агентно автономно навайбкодить без участия разработчика? Типа сказал "сделай, чтоб было красиво и работало" и вуа-ля, оно залезло тебе в голову, поняло что нужно и 6 часов потом ваяло? :) Причем за 6 часов - это ж тонны кода должны быть...
sidorovkv
15.09.2025 15:37Это очень интересный вопрос. Разработчик должен прямо в режиме реального времени смотреть что ваяет этот рой? Или разработчик сам формирует какие-то точки контроля чтобы понимать, что бюджет не отправляется в мусорку вместе с роем? И главное может ли рой вернуться к прошлому контексту после экстренной остановки если он профукал точку контроля и его стопанули целенаправленно? В общем да, пока выглядит как очень дорогая игрушка для больших корпораций. Интересно ждать этой осенью победных реляций от гендиров про то что они оставили одного разработчика из 100, потому что теперь программирует рой? Или опыт прошлой осени их чему все таки научил?
interesting-cs-math
15.09.2025 15:37И такие роевые агенты есть в открытом доступе, чтобы можно было запустить на ПК?
kuznetsovkd
Теперь надо придумать рой тестировщиков.
madballer34 Автор
Если верить героям колонки, то их придумали уже и даже дали «сущности» :)