Нет никаких доказательств успешности «браузерного эксперимента» Cursor / forpes.ru

Главная
Нет никаких доказательств успешности «браузерного эксперимента» Cursor

Нет никаких доказательств успешности «браузерного эксперимента» Cursor +39

23.01.2026 10:34

PatientZero 26 11000 Источник

14 января 2026 года Cursor опубликовала пост «Scaling long-running autonomous coding» (https://cursor.com/blog/scaling-agents).

В этом посте компания рассказала о своих экспериментах с «автономной работой кодинг-агентов в течение нескольких недель» со следующей чётко поставленной целью:

понять, насколько далеко мы можем продвинуться в сфере кодинга в проектах, для выполнения которых командам разработчиков обычно требуются месяцы

Компания рассказала о подходах, которые она попробовала, о предполагаемых причинах их провала и о том, как решались эти проблемы.

Наконец она достигла этапа, на котором нечто «решило большинство наших проблем с координацией и позволило масштабироваться до очень больших проектов», что, в свою очередь, привело к следующему:

Чтобы протестировать эту систему, мы поставили перед собой амбициозную цель: создание веб-браузера с нуля. Агенты работали примерно неделю и написали больше миллиона строк кода в тысяче файлов. Исходный код можно посмотреть в GitHub (https://github.com/wilsonzlin/fastrender)

И здесь объяснения становятся немного запутанными и нечёткими. Компания заявляет, что «несмотря на размер кодовой базы, новые агенты всё равно понимают её и добиваются существенного прогресса» и что «сотни воркеров работают конкурентно, выполняя пушинг в одну и ту же ветвь с минимальными конфликтами», но ни разу не говорит, был ли проект успешным, работает ли он на самом деле. Можем ли мы сами запустить этот браузер? Это неясно, и компания ни разу не сделала подобных чётких заявлений.

В посте есть такое видео:

А ниже говорится, что «хоть это и кажется простым скриншотом, создавать браузер с нуля крайне сложно».

Компания ни разу не заявила, что этот браузер работает и выполняет свои функции

error: could not compile 'fastrender' (lib) due to 34 previous errors; 94 warnings emitted

А если вы попробуете скомпилировать его сами, то убедитесь, что он очень далёк от состояния функционального браузера; похоже, что ни на одном из этапов его невозможно было собрать.

Множество недавних GitHub Actions, выполненных для main, показывают сбои (в том числе ошибки workflow-файлов), а при независимых попытках сборки возникают десятки компиляторных ошибок, недавние PR смерджены со сбойным CI, а вернувшись в истории Git назад на сто коммитов от самого недавнего, я не смог найти ни одного коммита, который компилируется без проблем.

Я не знаю точно, чем конкретно занимались те «агенты», которые работали с этой кодовой базой, но, похоже, они ни разу не выполняли cargo build или даже cargo check, потому что при запуске этих команд возникают десятки ошибок и примерно сто предупреждений. Об этом прямо сейчас есть открытое issue GitHub в репозитории проекта: https://github.com/wilsonzlin/fastrender/issues/98

И если это ещё неочевидно по ошибкам компиляции, при анализе кодовой базы любому разработчику ПО становится ясно, что её совершенно не проектировали. Это то, что называют «ИИ-слопом» — низкокачественное нечто, совершенно точно обозначающее что-то, но не имеющее в своей основе замысла и на текущем этапе даже не компилирующееся.

Ниже в посте компания начала рассуждать о том, что будет дальше, но ни единого слова не было сказано о том, как запускать браузер, чего от него ожидать и как он работает. В посте Cursor нет воспроизводимого демо и, за исключением ссылки на репозиторий, ни одной гарантированно хорошей ревизии (метки/релиза/коммита), подтверждающей показанное на скриншотах.

Каким бы ни был замысел, пост Cursor создаёт впечатление функционирующего прототипа, но не содержит базовых маркеров воспроизводимости, которые бы следовало ожидать при таком заявлении. Компания ни разу в явном виде не заявляла о работоспособности, поэтому, по крайней мере, никто не может обвинить её во лжи.

В конце статьи написано следующее:

Но на основной вопрос о том, можно ли масштабировать автономный кодинг, привлекая к решению задачи больше агентов, ответ оказался более оптимистичным, чем мы ожидали.

Это довольно странный вывод, ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.

«Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML. В посте Cursor не демонстрируется этот минимум, и попытки сообщества собрать проект тоже заканчиваются неудачей.

Заключение

Компания Cursor не говорила, что браузер готов к продакшену, но фразы «создание веб-браузера с нуля», «крайне сложно» и «существенный прогресс» и демонстрация скриншота призваны создать впечатление того, что эксперимент на самом деле завершился успешно.

Самым близким намёком на успех было это предложение:

Сотни агентов могут неделями совместно работать над кодовой базой, добиваясь реального прогресса в амбициозных проектах.

Но это поразительное заявление не подтверждено никакими доказательствами. В посте не приводится ни одного работающего коммита, инструкций по сборке или демо, которое можно воспроизвести.

Я не думаю, чтобы кто-то ожидал, что этот браузер станет новым Chrome, но считаю, что если вы заявляете о создании браузера, то надо как минимум показать возможность его компиляции + загрузки простейшего файла HTML.

Комментарии (26)

poruchik
23.01.2026 10:56
#29423946

...ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.

«Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML.

по вашей же ссылке скриншот главной страницы wikipedia https://github.com/wilsonzlin/fastrender/issues/98#issuecomment-3761559718
1. Lippiece
  23.01.2026 10:56
  #29428120
  Автор поста на хабре только перевел статью.
  
  "It quickly crashes" (в том же комменте).

Munafiqun
23.01.2026 10:56
#29424030
Отсутствие доказательства - не доказательство отсутствия.
1. steel835
  23.01.2026 10:56
  #29424652
  Тут скорее отсутствие доказательства - это доказательство неподкрепленности заявления, как я понял
  
  Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный
  1. ArZr
    23.01.2026 10:56
    #29424954
    Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный
    
    На первых порах вообще никто не мог собрать код. Затем выяснилось, что вполне возможно всё собрать, если самостоятельно исправить ошибки (их оказалось не так много, как ожидалось). После этого Cursor исправили эти ошибки (причем, как предполагают внимательные граждане, исправление было сделано не "агентами", а человеком), после чего сборка стала возможна без танцев с бубном. Автор оригинальной статьи, который тоже активно во всем этом расследовании, просто не обновил статью и не добавил эти детали (впрочем, учитывая, насколько печальна ситуация с этим "браузером" даже после исправлений, в обновлении статьи не сказать что есть нужда)
1. Dhwtj
  23.01.2026 10:56
  #29425342
  Отсутствие доказательства - не доказательство отсутствия
  
  Бремя доказательства на утверждающем [всякую дичь]
1. RulenBagdasis
  23.01.2026 10:56
  #29425918
  Я в последнее время постоянно вижу статьи о том, как ИИ заменил программистов и программирует теперь сам, но ещё ни разу я не увидел примера напрограммированного, чтобы это было сложнее того, что я в состоянии сам написать за пару выходных.
  
  ИИ очень полезен в работе, постоянно использую его как умный автокомплишен, для рефакторинга, как ревьювера кода, как написателя/редактора комментариев, даже как писателя небольших изолированных кусков кода. Но всё меньше верю в сказки про то, что LLM способна нормально написать что-то, действительно, сложное.
1. Lippiece
  23.01.2026 10:56
  #29428130
  Бог, может быть, и есть (этот аргумент чаще всего в этом контексте упоминается), но точно не production-ready long-running autonomous coding.

Qwest_Prozto
23.01.2026 10:56
#29424626
Мне вот всегда интересно - когда говорят про длительную разработку с ИИ - они вообще никогда не перезапускают чат, или как вообще им пользуются? В последнее время очень плотно игнорируется один факт - каждый новый запрос в любимую ИИ это отдельная новая сущность, связанная с предыдущим только промптом. При этом всегда есть провал внимания в середине данных, если их больше 20к токенов.
+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?
1. Wesha
  23.01.2026 10:56
  #29425816
  почему до сих пор никто не сделал агента
  
  Мы сделали вам X, чтобы вы могли X, пока вы X!
1. JerryI
  23.01.2026 10:56
  #29426210
  там есть history chat compression. Очень неплохо позволяет "наследовать" от одного к другому
1. amazingname
  23.01.2026 10:56
  #29427544
  + почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?
  
  Думаю потому, что агента именно так обучают разработке: он должен дать правильное продолжение собственной цикличной цепи рассуждений, включая способность планировать и баллансировать процесс. Если начать выдергивать у него информацию или добавлять с помощью другого агента, тогда придется обучать их обоих оптимально действовать именно в такой схеме. А до этого пока не добрались - нужно больше мощностей и материала.
1. verticalacid
  23.01.2026 10:56
  #29427674
  Это RAG. Для кода работает плохо.
  
  Если же вызывать полноценного оркестратора после каждого запроса кодера - денег не хватит. Только сжимать почаще (а не как Cursor).
  
  20k для SOTA давно семечки. Вот 200k проблема - видят далеко не все.

Dhwtj
23.01.2026 10:56
#29425334
Мотивация команды курсор понятна.

Тут понятно, что в качестве доказательства полезности курсора пойдет любой мусор. Тем более, что публичной критики нет. Кто будет критиковать сильно рискует карьерой.

В прошлой статье про этот проект я писал: для доказательства корректности браузера прод качества есть огромное количество тестов, порядка 3 млн. Такая задача здесь не ставилась.

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Кто я? Зачем я здесь? Не надо было вчера так нажираться
1. Wesha
  23.01.2026 10:56
  #29425820
  Мотивация команды курсор понятна
  
  — надо ж того слона продать!
1. atomlib
  23.01.2026 10:56
  #29427298
  Зачем вообще инвесторы отдали деньги человеку который выглядит так?
  
  Это вы ещё Виталика Бутерина не видели.
1. Lippiece
  23.01.2026 10:56
  #29428136
  Зачем вообще инвесторы отдали деньги человеку который выглядит так?
  
  Наверное, чтобы он запустил продукт? Если опустить неудачу в продукте, его выражение лица на этом фото никак не влияет на что бы то ни было.
  
  С таким же успехом можно прикрепить фото Эйнштейна с языком и спросить, почему мы пользуемся его исследованиями.