14 января 2026 года Cursor опубликовала пост «Scaling long-running autonomous coding» (https://cursor.com/blog/scaling-agents).

В этом посте компания рассказала о своих экспериментах с «автономной работой кодинг-агентов в течение нескольких недель» со следующей чётко поставленной целью:

понять, насколько далеко мы можем продвинуться в сфере кодинга в проектах, для выполнения которых командам разработчиков обычно требуются месяцы

Компания рассказала о подходах, которые она попробовала, о предполагаемых причинах их провала и о том, как решались эти проблемы.

Наконец она достигла этапа, на котором нечто «решило большинство наших проблем с координацией и позволило масштабироваться до очень больших проектов», что, в свою очередь, привело к следующему:

Чтобы протестировать эту систему, мы поставили перед собой амбициозную цель: создание веб-браузера с нуля. Агенты работали примерно неделю и написали больше миллиона строк кода в тысяче файлов. Исходный код можно посмотреть в GitHub (https://github.com/wilsonzlin/fastrender)

И здесь объяснения становятся немного запутанными и нечёткими. Компания заявляет, что «несмотря на размер кодовой базы, новые агенты всё равно понимают её и добиваются существенного прогресса» и что «сотни воркеров работают конкурентно, выполняя пушинг в одну и ту же ветвь с минимальными конфликтами», но ни разу не говорит, был ли проект успешным, работает ли он на самом деле. Можем ли мы сами запустить этот браузер? Это неясно, и компания ни разу не сделала подобных чётких заявлений.

В посте есть такое видео:

А ниже говорится, что «хоть это и кажется простым скриншотом, создавать браузер с нуля крайне сложно».

Компания ни разу не заявила, что этот браузер работает и выполняет свои функции

error: could not compile 'fastrender' (lib) due to 34 previous errors; 94 warnings emitted

А если вы попробуете скомпилировать его сами, то убедитесь, что он очень далёк от состояния функционального браузера; похоже, что ни на одном из этапов его невозможно было собрать.

Множество недавних GitHub Actions, выполненных для main, показывают сбои (в том числе ошибки workflow-файлов), а при независимых попытках сборки возникают десятки компиляторных ошибок, недавние PR смерджены со сбойным CI, а вернувшись в истории Git назад на сто коммитов от самого недавнего, я не смог найти ни одного коммита, который компилируется без проблем.

Я не знаю точно, чем конкретно занимались те «агенты», которые работали с этой кодовой базой, но, похоже, они ни разу не выполняли cargo build или даже cargo check, потому что при запуске этих команд возникают десятки ошибок и примерно сто предупреждений. Об этом прямо сейчас есть открытое issue GitHub в репозитории проекта: https://github.com/wilsonzlin/fastrender/issues/98

И если это ещё неочевидно по ошибкам компиляции, при анализе кодовой базы любому разработчику ПО становится ясно, что её совершенно не проектировали. Это то, что называют «ИИ-слопом» — низкокачественное нечто, совершенно точно обозначающее что-то, но не имеющее в своей основе замысла и на текущем этапе даже не компилирующееся.

Ниже в посте компания начала рассуждать о том, что будет дальше, но ни единого слова не было сказано о том, как запускать браузер, чего от него ожидать и как он работает. В посте Cursor нет воспроизводимого демо и, за исключением ссылки на репозиторий, ни одной гарантированно хорошей ревизии (метки/релиза/коммита), подтверждающей показанное на скриншотах.

Каким бы ни был замысел, пост Cursor создаёт впечатление функционирующего прототипа, но не содержит базовых маркеров воспроизводимости, которые бы следовало ожидать при таком заявлении. Компания ни разу в явном виде не заявляла о работоспособности, поэтому, по крайней мере, никто не может обвинить её во лжи.

В конце статьи написано следующее:

Но на основной вопрос о том, можно ли масштабировать автономный кодинг, привлекая к решению задачи больше агентов, ответ оказался более оптимистичным, чем мы ожидали.

Это довольно странный вывод, ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.

«Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML. В посте Cursor не демонстрируется этот минимум, и попытки сообщества собрать проект тоже заканчиваются неудачей.

Заключение

Компания Cursor не говорила, что браузер готов к продакшену, но фразы «создание веб-браузера с нуля», «крайне сложно» и «существенный прогресс» и демонстрация скриншота призваны создать впечатление того, что эксперимент на самом деле завершился успешно.

Самым близким намёком на успех было это предложение:

Сотни агентов могут неделями совместно работать над кодовой базой, добиваясь реального прогресса в амбициозных проектах.

Но это поразительное заявление не подтверждено никакими доказательствами. В посте не приводится ни одного работающего коммита, инструкций по сборке или демо, которое можно воспроизвести.

Я не думаю, чтобы кто-то ожидал, что этот браузер станет новым Chrome, но считаю, что если вы заявляете о создании браузера, то надо как минимум показать возможность его компиляции + загрузки простейшего файла HTML.

Комментарии (26)


  1. poruchik
    23.01.2026 10:56

    ...ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.

    «Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML.

    по вашей же ссылке скриншот главной страницы wikipedia https://github.com/wilsonzlin/fastrender/issues/98#issuecomment-3761559718


    1. Lippiece
      23.01.2026 10:56

      Автор поста на хабре только перевел статью.

      "It quickly crashes" (в том же комменте).


  1. Munafiqun
    23.01.2026 10:56

    Отсутствие доказательства - не доказательство отсутствия.


    1. steel835
      23.01.2026 10:56

      Тут скорее отсутствие доказательства - это доказательство неподкрепленности заявления, как я понял

      Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный


      1. ArZr
        23.01.2026 10:56

        Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный

        На первых порах вообще никто не мог собрать код. Затем выяснилось, что вполне возможно всё собрать, если самостоятельно исправить ошибки (их оказалось не так много, как ожидалось). После этого Cursor исправили эти ошибки (причем, как предполагают внимательные граждане, исправление было сделано не "агентами", а человеком), после чего сборка стала возможна без танцев с бубном. Автор оригинальной статьи, который тоже активно во всем этом расследовании, просто не обновил статью и не добавил эти детали (впрочем, учитывая, насколько печальна ситуация с этим "браузером" даже после исправлений, в обновлении статьи не сказать что есть нужда)


    1. Dhwtj
      23.01.2026 10:56

      Отсутствие доказательства - не доказательство отсутствия

      Бремя доказательства на утверждающем [всякую дичь]


    1. RulenBagdasis
      23.01.2026 10:56

      Я в последнее время постоянно вижу статьи о том, как ИИ заменил программистов и программирует теперь сам, но ещё ни разу я не увидел примера напрограммированного, чтобы это было сложнее того, что я в состоянии сам написать за пару выходных.

      ИИ очень полезен в работе, постоянно использую его как умный автокомплишен, для рефакторинга, как ревьювера кода, как написателя/редактора комментариев, даже как писателя небольших изолированных кусков кода. Но всё меньше верю в сказки про то, что LLM способна нормально написать что-то, действительно, сложное.


    1. Lippiece
      23.01.2026 10:56

      Бог, может быть, и есть (этот аргумент чаще всего в этом контексте упоминается), но точно не production-ready long-running autonomous coding.


  1. Qwest_Prozto
    23.01.2026 10:56

    Мне вот всегда интересно - когда говорят про длительную разработку с ИИ - они вообще никогда не перезапускают чат, или как вообще им пользуются? В последнее время очень плотно игнорируется один факт - каждый новый запрос в любимую ИИ это отдельная новая сущность, связанная с предыдущим только промптом. При этом всегда есть провал внимания в середине данных, если их больше 20к токенов.
    + почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?


    1. Wesha
      23.01.2026 10:56

      почему до сих пор никто не сделал агента

      Мы сделали вам X, чтобы вы могли X, пока вы X!


    1. JerryI
      23.01.2026 10:56

      там есть history chat compression. Очень неплохо позволяет "наследовать" от одного к другому


    1. amazingname
      23.01.2026 10:56

      + почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?

      Думаю потому, что агента именно так обучают разработке: он должен дать правильное продолжение собственной цикличной цепи рассуждений, включая способность планировать и баллансировать процесс. Если начать выдергивать у него информацию или добавлять с помощью другого агента, тогда придется обучать их обоих оптимально действовать именно в такой схеме. А до этого пока не добрались - нужно больше мощностей и материала.


    1. verticalacid
      23.01.2026 10:56

      Это RAG. Для кода работает плохо.

      Если же вызывать полноценного оркестратора после каждого запроса кодера - денег не хватит. Только сжимать почаще (а не как Cursor).

      20k для SOTA давно семечки. Вот 200k проблема - видят далеко не все.


  1. Dhwtj
    23.01.2026 10:56

    Мотивация команды курсор понятна.

    Тут понятно, что в качестве доказательства полезности курсора пойдет любой мусор. Тем более, что публичной критики нет. Кто будет критиковать сильно рискует карьерой.

    В прошлой статье про этот проект я писал: для доказательства корректности браузера прод качества есть огромное количество тестов, порядка 3 млн. Такая задача здесь не ставилась.

    Зачем вообще инвесторы отдали деньги человеку который выглядит так?

    Кто я? Зачем я здесь? Не надо было вчера так нажираться
    Кто я? Зачем я здесь? Не надо было вчера так нажираться


    1. Wesha
      23.01.2026 10:56

      Мотивация команды курсор понятна

      — надо ж того слона продать!


    1. atomlib
      23.01.2026 10:56

      Зачем вообще инвесторы отдали деньги человеку который выглядит так?

      Это вы ещё Виталика Бутерина не видели.


    1. Lippiece
      23.01.2026 10:56

      Зачем вообще инвесторы отдали деньги человеку который выглядит так?

      Наверное, чтобы он запустил продукт? Если опустить неудачу в продукте, его выражение лица на этом фото никак не влияет на что бы то ни было.

      С таким же успехом можно прикрепить фото Эйнштейна с языком и спросить, почему мы пользуемся его исследованиями.